Numerik Partieller Differentialgleichungen

Transcrição

Numerische Mathematik 2
(Numerik Partieller Differentialgleichungen)
Rolf Rannacher
Institut für Angewandte Mathematik
Universität Heidelberg
Vorlesungsskriptum WS 2007/2008
12. Februar 2008
ii
Adresse des Autors:
Institut für Angewandte Mathematik
Universität Heidelberg
Im Neuenheimer Feld 293/294
D-69120 Heidelberg, Deutschland
[email protected]
http://www.numerik.uni-hd.de
Inhaltsverzeichnis
Literaturverzeichnis
vi
0 Einleitung
1
0.1
Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
0.2
Ableitung von partiellen Differentialgleichungen . . . . . . . . . . . . . . . . . . .
3
0.3
Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
0.4
Numerische Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1 Theorie partieller Differentialgleichungen
9
1.1
Typeneinteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.2
Elliptische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
1.2.1
Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.2.2
Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.2.3
Stetige Abhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.2.4
Regularität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Hilfsmittel aus der Theorie von Funktionenräumen . . . . . . . . . . . . . . . . .
24
1.3.1
Sobolew-Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
1.3.2
Eigenschaften von Lebesgue- und Sobolew-Räumen . . . . . . . . . . . . .
27
1.3.3
Elemente der Spektraltheorie elliptischer Operatoren . . . . . . . . . . . .
31
1.4
Parabolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
1.5
Hyperbolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
1.6
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
1.3
2 Differenzen-Verfahren für elliptische Probleme
2.1
2.2
2.3
2.4
45
Allgemeine Differenzenapproximationen . . . . . . . . . . . . . . . . . . . . . . .
45
2.1.1
Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Eigenschaften der Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . .
51
2.2.1
Das Konvergenzverhalten von Differenzenverfahren . . . . . . . . . . . . .
55
Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
2.3.1
Aufwandsanalyse: ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . .
64
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
iii
iv
INHALTSVERZEICHNIS
3 Finite-Elemente-Verfahren für elliptische Probleme
3.1
73
Allgemeine Projektionsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3.1.1
Beispiele von Galerkin-Ansatzräumen . . . . . . . . . . . . . . . . . . . .
78
3.1.2
Diskretes Maximumprinzip für Finite-Elemente-Approximationen . . . . .
84
3.1.3
Approximation krummer Ränder . . . . . . . . . . . . . . . . . . . . . . .
86
3.2
Allgemeine Finite-Elemente-Ansätze . . . . . . . . . . . . . . . . . . . . . . . . .
91
3.3
Interpolation mit finiten Elementen . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4
A priori Fehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.4.1
3.5
3.6
3.7
Punktweise Fehlerabschätzung . . . . . . . . . . . . . . . . . . . . . . . . 110
Implementierungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.5.1
Aufbau der Systemmatrizen und Vektoren . . . . . . . . . . . . . . . . . . 118
3.5.2
Konditionierung der Systemmatrix . . . . . . . . . . . . . . . . . . . . . . 120
3.5.3
Aufstellung der Systemmatrizen mit numerischer Integration . . . . . . . 123
A posteriori Fehleranalyse und Gittersteuerung . . . . . . . . . . . . . . . . . . . 132
3.6.1
Allgemeine a posteriori Fehlerabschätzung . . . . . . . . . . . . . . . . . . 132
3.6.2
Spezielle a posteriori Fehlerschätzer . . . . . . . . . . . . . . . . . . . . . 136
3.6.3
Strategien zur Gittersteuerung . . . . . . . . . . . . . . . . . . . . . . . . 141
3.6.4
Ein Testbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4 Iterative Lösungsverfahren für FD- und FE-Gleichungen
4.1
4.2
4.3
Krylow-Raum-Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.1.1
Verfahren der konjugierten Richtungen (CG-Verfahren) . . . . . . . . . . 159
4.1.2
CG-Verfahren für unsymmetrische und indefinite Probleme . . . . . . . . 164
4.1.3
Vorkonditionierung (PCG-Verfahren) . . . . . . . . . . . . . . . . . . . . . 165
Mehrgitterverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.2.1
Mehrgitteralgorithmus im Finite-Elemente-Kontext . . . . . . . . . . . . . 169
4.2.2
Konvergenz- und Aufwandsanalyse . . . . . . . . . . . . . . . . . . . . . . 174
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5 Verfahren für parabolische Probleme
5.1
157
183
Differenzenverfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . . 187
5.1.1
Zeitschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.1.2
Stabilität und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
INHALTSVERZEICHNIS
5.2
v
FE-Galerkin-Verfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . 203
5.2.1
A priori Konvergenzabschätzungen . . . . . . . . . . . . . . . . . . . . . . 204
5.2.2
Fehlerkontrolle und Schrittweitensteuerung . . . . . . . . . . . . . . . . . 208
5.3
Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 215
5.4
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6 Verfahren für hyperbolische Probleme
221
6.1
Differenzenverfahren für hyperbolische Probleme . . . . . . . . . . . . . . . . . . 221
6.2
Finite-Elemente-Verfahren für hyperbolische Probleme . . . . . . . . . . . . . . . 228
6.3
Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 230
6.4
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
Index
233
vi
INHALTSVERZEICHNIS
Literaturverzeichnis
[1] R. Rannacher: Numerische Mathematik 0 (Einf. in die Numerische Mathematik),
Vorlesungsskriptum, Universität Heidelberg,
http://numerik.uni-hd.de/∼lehre/notes/
[2] R. Rannacher: Numerische Mathematik 1 (Numerik Gew. Differentialgleichungen),
Vorlesungsskriptum, Universität Heidelberg,
http://numerik.uni-hd.de/∼lehre/notes/
(I) Theorie partieller Differentialgleichungen
[3] G. Hellwig: Partielle Differentialgleichungen,
B.G. Teubner 1960.
[4] A. Friedman: Partial Differential Equations,
Holt, Rinehart und Winston 1970.
[5] F. John: Partial Differential Equations,
Springer 1978.
[6] J. Wloka: Partielle Differentialgleichungen, Sobolewräume und Randwertaufgaben,
B.G. Teubner 1982.
[7] W. R. Strauss: Partial Differential Equations: An Introduction,
John Wiley 1992.
[8] M. Renardy, R. Rogers: An Introduction to Partial Differential Equations,
Springer 1993.
[9] A. Tveito, R. Winther: Introduction to Partial Differential Equations: A Computational
Approach, Springer 1998.
(II) Numerik partieller Differentialgleichungen
[10] R. D. Richtmeyer, K. W. Morton: Difference Methods for Initial Value Problems,
Interscience 1967.
[11] G. Strang, G. J. Fix: An Analysis of the Finite Element Method,
Prentice-Hall 1973.
[12] A. R. Mitchell: Computational Methods in Partial Differential Equations,
John Wiley 1976.
[13] A. R. Mitchell, R. Wait: The Finite Element Method in Partial Differential Equations,
John Wiley 1977.
[14] P. G. Ciarlet: The Finite Element Method for Elliptic Problems,
North-Holland 1978.
[15] A. R. Mitchell, D. F. Griffiths: The Finite Difference Method in Partial Differential Equations, John Wiley 1980.
vii
viii
LITERATURVERZEICHNIS
[16] O. Axelsson, V. A. Barker: Finite Element Solution of Boundary Value Problems, Theory
and Computation, Academic Press 1984.
[17] V. Thome: Galerkin Finite Element Methods for Parabolic Problems,
Springer 1984.
[18] W. Hackbusch: Theorie und Numerik elliptischer Differentialgleichungen,
B. G. Teubner 1986.
[19] C. Johnson: Numerical Solution of Partial Differential Equations by the Finite Element
Method, Cambridge University Press 1987.
[20] H. R. Schwarz: Methode der finiten Elemente,
B. G. Teubner 1991.
[21] W. Hackbusch: Iterative Lösung großer schwachbesetzter Gleichungssysteme,
B. G. Teubner 1991.
[22] F. Brezzi, M. Fortin: Mixed and Hybrid Finite Element Methods,
Springer 1991.
[23] D. Braess: Einführung in die Methode der Finiten Elemente,
Springer 1991.
[24] Ch. Großmann, H.-G. Roos: Numerik partieller Differentialgleichungen,
B. G. Teubner 1992.
[25] H. Goering, H.-G. Roos, L. Tobiska: Finite-Elemente-Methode,
Akademie-Verlag 1993.
[26] S. C. Brenner, L. R. Scott: The Mathematical Theory of Finite Element Methods,
Springer 1994.
[27] A. Quarteroni, A. Valli: Numerical Approximation of Partial Differential Equations,
Springer 1994.
[28] K. Eriksson, D. Estep, P. Hansbo, C. Johnson: Computational Differential Equations,
Cambridge University Press 1996.
[29] P. Knabner, L. Angermann: Numerik partieller Differentialgleichungen,
Springer 2000.
0 Einleitung
Gegenstand dieser Vorlesung sind numerische Algorithmen zur näherungsweisen Lösung von
partiellen Differentialgleichungen. In der Regel lassen sich für die in der Praxis auftretenden
partiellen Differentialgleichungen keine Lösungen in analytischer Form angeben. Man ist also auf
numerische Approximation angewiesen. Dabei wird das kontinuierliche Ausgangsproblem durch
ein diskretes“, d.h. endlich dimensionales, ersetzt und dieses dann mit Hilfe des Computers
”
gelöst.
0.1 Notation
Wir stellen zuächst einige der im folgenden verwendeten Begriffe und abkürzenden Bezeichnungen zusammen.
i) Unabhängige Variable: Wir betrachten (offene beschränkte) Gebiete Ω ⊂ Rd für d = 1, 2, 3
mit Rand ∂Ω. Der äußere Normaleneinheitsvektor zu ∂Ω ist n. Punkte im Rd sind x =
(x1 , ..., xd )T oder im R3 auch (x, y, z)T . Die Zeitvariable ist t. Für d-dimensionale Vektoren a, b wird das übliche euklidische1 Produkt mit (a, b) oder auch mit a · b bezeichnet.
Die euklidische Vektornorm ist kak := (a, a)1/2 und die zugehörige natürliche Matrizennorm
kAk := maxx∈Rd {kAxk, kxk = 1}.
ii) Funktionen: Wir betrachten im allgemeinen skalare Funktionen u = u(x) oder u = u(x, t)
für Argumente x ∈ Rd bzw. t ∈ R. In einigen Fällen treten auch vektorwertige Funktionen auf
u = (u1 , ..., ud )T , die im allgemeinen wie skalare Funktionen bezeichnet werden. Analog werden
Skalarprodukte und Normen über ein Gebiet Ω unterschiedslos für skalare wie für vektorwertige
Funktionen verwendet.
iii) Ableitungen: Für Funktionen u(t) , u(x) bzw. u(x, t) werden totale sowie partielle Ableitungen abgekürzt geschrieben als
dt u :=
du
,
dt
∂t u :=
∂u
,
∂t
∂x u :=
∂u
,
∂x
∂i u :=
∂u
,
∂xi
u.s.w.
und analog auch für höhere Ableitungen, z.B.: ∂tp u und ∂xq u . Mit dem Nabla-Operator ∇ werden der Gradient einer skalaren Funktion sowie die Divergenz einer Vektorfunktion geschrieben
als grad u = ∇u := (∂1 u, ..., ∂d u)T und div u = ∇ · u := ∂1 u1 + ... + ∂d ud . Zu einem Vektor
β ∈ Rd wird die Ableitung in Richtung β mit ∂β u := β · ∇u bezeichnet. Entsprechend ist z.B.
∂n u = n · ∇u die Ableitung in Richtung der äußeren Normalen entlang des Gebietsrandes ∂Ω .
Kombination von Divergenz- und Gradientenbildung ergibt den sog. Laplace2 -Operator“
”
∇ · (∇u) = ∆u = ∂12 u + ... + ∂d2 u.
Mit dem Symbol ∇m u bezeichnen wir den Tensor aller partiellen Ableitungen der Ordnung m
von u ; z.B. in zwei Dimensionen ∇2 u = (∂xi ∂yj u)i+j=2 .
1
Euklid (ca. 355-290 v. Chr.): griechischer Philosoph und Mathematiker; wirkte in Alexandria; sein mehrbändigen Lehrbuch “Die Elemente” faßte die Grundlagen der klassischen Geometrie zusammen; von ihm stammt das
klassische mathematische Ausdrucksschema “Voraussetzung - Behauptung - Beweis”.
2
Pierre Simon Marquis de Laplace (1749-1827): französischer Mathematiker und Astronom; Prof. in Paris;
begründete u.a. die Wahrscheinlichkeitsrechnung.
1
2
Einleitung
iv) Integralsätze: Für stückweise glatt berandete Gebiete Ω ⊂ Rd und hinreichend glatte Funktionen u, v gelten der klassische Integralsatz von Gauß3
Z
Z
n · u do,
(0.1.1)
∇ · u dx =
∂Ω
Ω
sowie als Folgerung die Integralformel von Green4
Z
Z
Z
u∆v dx.
u∂n v do −
∇u · ∇v dx =
(0.1.2)
Ω
∂Ω
Ω
v) Funktionenräume: Auf Punktmengen Ω ∈ Rd verwenden wir die üblichen Vektorräume von
stetigen bzw. stetig differenzierbaren Funktionen
C(Ω),
C m (Ω),
C0∞ (Ω).
Der Raum C(Ω) ist, versehen mit der Maximumnorm
kuk∞;Ω := max |u(x)|,
x∈Ω
vollständig, d.h. ein Banach-Raum5 . Weiter ist L2 (Ω) der Raum der auf Ω meßbaren und im
Lebesgueschen Sinne quadratintegrablen Funktionen. Versehen mit dem Skalarprodukt und der
zugehörigen Norm
Z
u(x)v(x) dx,
(u, v)Ω :=
Ω
1/2
kukΩ = (u, u)Ω ,
ist L2 (Ω) vollständig, d.h. ein Hilbert-Raum6 . Wenn der Definitionsbereich Ω aus dem Zusammenhang klar ist, wird er in der Bezeichnung von Skalarprodukten und Normen meist weggelassen; z.B.: kuk = kukΩ . Weitere Funktionenräume werden später an den Stellen eingeführt,
wo sie gebraucht werden.
vi) Ungleichungen: Wir listen einige der im folgenden häufig verwendeten Ungleichungen für
Funktionen aus den oben definierten Funktionenräumen. Für Funktionen u, v ∈ L2 (Ω) gilt die
Höldersche7 Ungleichung“
”
Z
Z
1/2 Z
1/2
|u(x)|2 dx
u(x)v(x) dx ≤
|v(x)|2 dx
,
(0.1.3)
Ω
3
Ω
Ω
Carl Friedrich Gauß (1777-1855): bedeutender deutscher Mathematiker, Astronom und Physiker; wirkte in
Göttingen.
4
George Green (1793-1841): englischer Mathematiker; Autodidakt und Besitzer einer Mühle; Beiträge zur
Potentialtheorie.
5
Stefan Banach (1892-1945): polnischer Mathematiker; Prof. in Lvov; begründete die Funktionalanalysis.
6
David Hilbert (1862-1943): bedeutender deutscher Mathematiker; wirkte in Königsberg und Göttingen; begründete u. a. den axiomatischen Aufbau der Mathematik; zum Wesen der Axiomatik (in der Geometrie) sagte
er “Man muß jederzeit anstelle von Punkten, Geraden, Ebenen - Tische, Stühle, Bierseidel sagen können”.
7
Ludwig Otto Hölder (1859-1937): deutscher Mathematiker; Prof. in Tübingen; Beiträge zunächst zur Theorie
der Fourier-Reihen und später vor allem zur Gruppentheorie; fand 1884 die nach ihm benannte Ungleichung.
0.2 Ableitung von partiellen Differentialgleichungen
3
bzw. in kompakter Schreibweise: |(u, v)|Ω ≤ kukΩ kvkΩ . Für Funktionen u ∈ C(Ω) ∩ C 1 (Ω) mit
den Eigenschaften u|∂Ω = 0 und |∇u| ∈ L2 (Ω) gilt die Poincarésche8 Ungleichung“
”
1/2
1/2
Z
Z
|∇u(x)|2 dx
|u(x)|2 dx
,
(0.1.4)
≤ dΩ
Ω
Ω
bzw. in kompakter Schreibweise: kukΩ ≤ dΩ k∇ukΩ , wobei dΩ := diam(Ω) .
0.2 Ableitung von partiellen Differentialgleichungen
Partielle Differentialgleichungen werden meist als mathematische Modelle zur Beschreibung physikalischer Vorgänge abgeleitet. Ziel ist es, die Eigenschaften dieser Vorgänge durch die Gleichungen möglichst vollständig zu erfassen und davon ausgehend dann ihren Ablauf vorherzusagen.
Bei der Konstruktion solcher Gleichungen geht man häufig nach recht formalen Regeln vor und
verwendet Analogieschlüsse. Völlig unterschiedliche physikalische Prozesse lassen sich häufig
durch Gleichungen sehr ähnlicher Gestalt beschreiben.
i) Harmonische (d.h. schwingende“) Ausbreitungsvorgänge sind z.B. die Ausbreitung einer Was”
serwelle (lokale Störung der Wasseroberfläche) oder eines Geräuschs (lokale Störung der Luftdichte). Es erscheint sinnvoll, diese im einfachsten Fall durch eine Funktion u = u(x, t) im Ort
x und der Zeit t der Form u(x, t) = sin(x) sin(t) zu beschreiben. Diese genügt der Differentialgleichung
∂t2 u = ∂x2 u.
(0.2.5)
Es zeigt sich, daß diese sog. Wellengleichung“ tatsächlich die in der Natur auftretenden Schwin”
gungsvorgänge beschreibt. Sie ist der Prototyp einer hyperbolischen“ Differentialgleichung.
”
ii) Andere Ausbreitungsvorgänge sind dadurch gekennzeichnet, daß lokale Störungen nicht schwingend, sondern diffundierend“ und sich abschwächend fortgepflanzt werden, z.B.: Temperatur”
ausbreitung in einem Leiter (Wärmeleitung) oder Verteilung einer Dichtekonzentration in einer
Flüssigkeit (Stofftransport). Zur Beschreibung solcher Vorgänge dienen Funktionen der Form
u(x, t) = sin(x) e−t . Diese genügen der Differentialgleichung
∂t u = ∂x2 u.
(0.2.6)
Es zeigt sich, daß diese sog. Wärmeleitungsgleichung“ tatsächlich die in der Natur auftreten”
den Diffusionsvorgänge beschreibt. Sie ist der Prototyp einer parabolischen“ Differentialglei”
chung. In Fall zweier Raumdimensionen, u = u(x, y, t) , lautet die Wärmeleitungsgleichung unter
Berücksichtigung von externen Wärmequellen
∂t u = ∂x2 u + ∂y2 u = ∆u + f.
(0.2.7)
8
Jules Henri Poincaré (1854-1912): französischer Mathematiker; Prof. an der École Polytechnique und der
Sorbonne in Paris; eins der letzten mathematischen Universalgenies; fundamentale Beiträge zu allen Bereichen
der Mathematik, zur Himmelsmechanik, Strömungsmechanik und Wissenschaftsphilosophie.
4
Einleitung
iii) Der Grenzzustand für t → ∞ eines Diffusionsprozesses u(x, y, t) , z.B. beschrieben durch
die Wärmeleitungsgleichung (0.2.7), ist als Lösung der sog. Poisson9 -Gleichung“
”
−∆u = −∂x2 u − ∂y2 u = f,
(0.2.8)
gegeben. Diese ist der Prototyp einer elliptischen“ Differentialgleichung.
”
0.3 Beispiele
Die folgenden Beispiele aus verschiedenen Wissenschaftsdisziplinen vermitteln einen Eindruck
von der Vielfältigkeit der auftretenden Probleme.
1. Erhaltungsgleichungen
Die Grundgleichungen der (klassischen) Kontinuumsmechanik basieren auf dem physikalischen
Grundprinzip der Erhaltung“, d.h.: Zustandsgrößen wie z.B. Massedichte ρ(x, t), innere Ener”
gie bzw. Temperatur T (x, t), Impuls ρ(x, t)~v (x, t), u.s.w., werden als Dichtefunktionen beschrieben, deren Integrale über beliebige bewegte Kontrollvolumen“ sich beim Fehlen von äußeren
”
Einflüssen nicht verändern. Für die zeitliche Veränderung der Masse mV (t) eines solchen mit
dem Geschwindigkeitsfeld v = (v1 , v2 , v3 ) bewegten Volumens V (t) gilt (sog. Reynoldsches10
”
Transporttheorem“)
Z
Z
{∂t ρ + ∇ · (ρv)} dx.
(0.3.9)
ρ(x, t) dx =
0 = dt mV (t) = dt
V (t)
V (t)
Da dies für beliebige Volumen V (t) gelten soll, ergibt sich für stetige Dichtefunktionen die
folgende Erhaltungsgleichung 1. Ordnung (sog. Kontinuitätsgleichung“):
”
∂t ρ + ∇ · (ρv) = 0.
(0.3.10)
Auf analogem Wege erhält man aus dem Erhaltungssatz für die Temperatur unter Berücksichtigung von Quelltermen und Wärmediffusion in einem ruhenden Medium ( ~v ≡ 0) die folgende
Erhaltungsgleichung 2. Ordnung (sog. Wärmeleitungsgleichung“):
”
∂t T − ∇ · (a∇T ) = ∇ · q,
(0.3.11)
Physikalische Anschauung erfordert, daß Lösungen zu diesen Gleichungen bei physikalisch sinnvollen Anfangs- und Randbedingungen stets positiv sind: ρ > 0, T > 0 . Wir werden sehen, daß
dies tatsächlich der Fall ist. Die entsprechenden Erhaltungssätze für Impuls und Drehimpuls
führen unter geeigneten zusätzlichen Annahmen zusammen mit der Kontinuitätsgleichung auf
9
Siméon Denis Poisson (1781-1840): französischer Mathematiker und Physiker; Prof. in Paris; Beiträge zur
mathematischen Formulierung der Physik, zum Magnetismus, zur Himmelsmechanik und Wahrscheinlichkeitsrechnung; einer der Begründer der Potentialtheorie.
10
Osborn Reynolds (1842-1912): englischer Ingenieur und Mathematiker; Prof. in Manchester; Beiträge zur
Theorie des Elektro-Magnetismus und der Strömungslehre, Fundamente der Turbulenzbeschreibung und der hydrodynamischen Stabilität.
0.3 Beispiele
5
die bekannten Navier11 -Stokes12 -Gleichungen“ für inkompressible, Newtonsche Fluide mit kon”
stanter Dichte und Temperatur ( ρ ≡ konst., T ≡ konst.):
∂t v − ν∆v + v · ∇v + ∇p = f,
∇ · v = 0.
(0.3.12)
Diese werden hier aber nur der Vollständigkeit halber formuliert und im Laufe dieser Vorlesung
nicht näher betrachtet.
2. Variationsgleichungen
Die Grundgleichungen der (klassischen) Elastizitätstheorie basieren auf dem physikalischen Grundprinzip der Energieminimierung“, d.h.: Der von einem elastischen Körper unter statischer
”
äußerer Belastung eingenommene Zustand ist so betimmt, daß er die potentielle Gesamtenergie des Systems minimiert. Zur Beschreibung eines elastischen Systems werden in der linearen
Theorie die folgenden Größen verwendet: der Verschiebungsvektor u , der Verzerrungstensor
ε(u) := 12 (∇u + ∇uT ) , der flächenorientierte (symmetrische) Spannungstensor σ und die Volumenkraft f . Die Spannungen σ sind die Reaktionskräfte des Körpers auf von außen erzwungene
Verzerrungen ε(u) und werden idealisierend in einer linearen Beziehung angenommen, dem sog.
(elastischen) Materialgesetz“, σ = Aε(u) , mit dem symmetrischen und positiv definiten Elasti”
zitätstensor A . Die potentielle Gesamtenergie des belasteten, elastischen Körpers schreibt sich
dann in der Form:
Z
Z
Z
Z
1
1
f u dx =
f u dx.
(0.3.13)
σ : ε(u) dx −
Aε(u) : ε(u) dx −
E(u) =
2 Ω
2 Ω
Ω
Ω
Die sich unter der äußeren Belastung einstellende Verschiebung in einen neuen Gleichgewichtszustand u∗ verleiht dann E(·) einen minimalen Wert unter allen zulässigen Verschiebungen,
d.h. solchen mit denselben Randwerten. Für einen solchen optimalen Zustand u∗ gilt dann
notwendig
d
E(u∗ + εϕ)|ε=0 = 0,
dε
für beliebige zulässige“ Variationen ϕ . Auswertung dieser Beziehung liefert die sog. Variati”
”
onsgleichung“
(Aε(u), ε(ϕ))Ω = (f, ϕ)Ω
∀ zulässigen“ ϕ.
”
(0.3.14)
Dabei bedeutet zulässig“ für eine Testfunktion ϕ, daß sie hinreichend glatt ist und entlang des
”
Randes ∂Ω verschwindet. Nimmt man an, daß das Minimum u hinreichend glatt ist, so folgt
durch partielle Integration
(∇ · Aε(u) + f, ϕ)Ω = 0 ∀ zulässigen“ ϕ,
”
11
Claude Louise Marie Henri Navier (1785-1836): französischer Bauingenieur und Mathematiker; Prof. an der
École Polytechnique in Paris; Beiträge zum Brückenbau (erste Theorie der Hängebrücke), Elastizitätstheorie und
Strömungsmechanik.
12
Sir Georg Gabriel Stokes (1819-1903): englischer Mathematiker und Physiker; Prof. in Cambridge; Beiträge
zur Differential- und Integralrechnung, zur Hydrodynamik und zur Theorie des Lichts, Spektralanalyse und
Fluoreszenz.
6
Einleitung
und hieraus das Differentialgleichungssystem 2. Ordnung (in kompakter sowie ausführlicher
Schreibweise)
−∇ · Aε(u) = f
⇔
−
d
d X
X
∂i Aijkl εkl (u) = fj
(j = 1, ..., d).
(0.3.15)
i=1 k,l=1
Der wohl einfachste (mehrdimensionale) Spezialfall eines elastisch deformierten Körpers ist
die eingespannte Membran“ in einem (beschränkten) Gebiet Ω ⊂ R2 (Trommelfell). Hier wird
”
eine Belastung nur in vertikaler Richtung zugelassen f~ = (0, 0, f ) und entsprechend auch nur
die Auslenkung in vertikaler Richtung ~u = (0, 0, u) berücksichtigt. Der Elastizitätstensor ist
diagonal und wird hier der Einfachheit halber zu A = aI gesetzt. Dann nimmt das obige
Funktional der potentiellen Gesamtenergie die Form an
E(u) = 12 ak∇uk2Ω − (f, u)Ω ,
(0.3.16)
und die zugehörige Differentialgleichung ( Poisson-Gleichung“) lautet
”
−a∆u = f,
in Ω.
(0.3.17)
Da die Membran am Rand eingespannt sein soll, muß weiter u|∂Ω = 0 sein.
In einer elastischen Membran wirken als Gegenkräfte zur Belastung reine Federkräfte (in
vertikaler Richtung) und keine Biegemomente. Dies ist begründet durch die Vernachlässigung
der Dicke der Membran. Flache Körper mit (konstanter) positiver, aber geringer Dicke werden als Platten“ bezeichnet. Im Rahmen der linearen Kirchhoffschen Plattentheorie“ werden
”
”
zwar Biegemomente berücksichtigt, aber nur vertikale Verschiebungen zugelassen ( Kirchhoff”
Hypothese“). Im Fall kleiner Verschiebungen (gegenüber der Plattendicke) erhält dann die potentielle Gesamtenergie die Form
E(u) = 12 Dk∆uk2Ω + (1 − σ)D (∂12 u, ∂22 u)Ω − k∂1 ∂2 uk2Ω − (f, u)Ω ,
mit Materialparametern σ ∈ (0, 1), D > 0 . Die zulässigen Funktionen müssen in diesem Fall quadratintegrable zweite Ableitungen besitzen. Durch den Variationsansatz wie oben erhält man als
notwendige (und hinreichende) Bedingung für ein Energieminimum die sog. Plattengleichung“
”
D∆2 u = f.
(0.3.18)
Aus naheliegenden Gründen wird der Operator 4. Ordnung ∆2 auch biharmonischer Opera”
tor“ genannt. Ist die Platte am Gebietsrand eingespannt“, so müssen die Randbedingungen
”
u|∂Ω = 0, ∂n u|∂Ω = 0 erfüllt sein. Wir merken an, daß ein identisches Modell bei der Beschreibung viskoser, inkompressibler Strömungen in zwei Raumdimensionen als Gleichung für die sog.
Stromfunktion“ ϕ auftritt; das Geschwindigkeitsfeld ergibt sich dabei durch Rotationsbildung
”
u := (∂y ϕ, −∂x ϕ)T .
3. Schwingungsgleichungen
Wenn der elastische Körper unter Belastung zeitliche Schwingungen ausführen kann, so wird die
zugehörige Auslenkung eine Funktion des Orts und der Zeit, u(x, t), und genügt im Rahmen
0.4 Numerische Methoden
7
der linearen Theorie der sog. elastische Schwingungsgleichung“
”
∂t2 u − ∇ · Aε(u) = f.
(0.3.19)
Die Gleichung für die frei schwingende Membran ist die klassische Wellengleichung“
”
∂t2 u = a∆u.
(0.3.20)
Diese beschreibt allgemein die Ausbreitung von Wellen in schwingfähigen Medien (z.B. Schallwelle in einem Gas, Auslenkung einer elastischen Membran oder die Amplitude eines elektrischen
Feldes). Sie wird üblicherweise zusammen mit Randbedingungen“ u|∂Ω = 0 sowie Anfangsbe”
”
dingungen“ u|t=0 = u0 , ∂t u|t=0 = u1 betrachtet.
0.4 Numerische Methoden
Aus den oben skizzierten Wegen zur Herleitung von partiellen Differentialgleichungen gewinnt
man unmittelbar Ansätze zu deren Diskretisierung.
1. Differenzenverfahren
Ersetzt man die Ableitungen in den Differentialgleichungen (0.2.5), (0.2.6), (0.2.7) und (0.2.8)
durch geeignete Differenzenquotienten bezüglich eines regulären Punktegitters, gewinnt man
lineare Gleichungen für die zugehörigen diskreten“ Funktionswerte. Dies ist eine sog. Differen”
”
zenapproximation“ der Differentialgleichung. Die Eigenschaften solcher Differenzengleichungen,
d.h. ihre Lösbarkeit und Approximationsgüte, werden weiter unten eingehend behandelt.
2. Finite-Volumen-Verfahren
Die lokale Erhaltungseigenschaft (0.3.9) führt dadurch auf ein numerisches Verfahren, daß man
für die Lösung einen bzgl. einer endlichen Zerlegung des Gebiets Ω in Teilvolumina (z.B. Dreiecke oder Vierecke) stückweise konstanten Ansatz macht und die Gültigkeit der Erhaltungseigenschaften dafür auf jedem der sog. Kontrollvolumen fordert. Dies führt auf ein algebrai”
”
sches Gleichungssystem für die zugehörigen Zellmittelwerte. Dieser Diskretisierungsansatz wird
Finite-Volumen-Methode“ genannt. Derartige Methoden finden hauptsächlich im Bereich der
”
numerischen Strömungsmechanik Anwendung. Wegen ihrer eingeschränkten Anwendbarkeit und
schwierigen Analysierbarkeit werden wir uns mit dieser Methodenklasse in dieser Vorlesung nicht
weiter befassen.
3. Variationsmethoden ( Methode der finiten Elemente“)
”
Die Variationsgleichung (0.3.14) führt durch Einschränkung auf einen endlich dimensionalen
Teilraum Vh des Lösungsraums des kontinuierlichen Variationsproblems auf eine diskrete Variationsaufgabe
(Aε(uh ), ε(ϕh ))Ω = (f, ϕh )Ω
∀ zulässigen“ ϕh ∈ Vh .
”
(0.4.21)
8
Einleitung
Dies ist äquivalent zu einem linearen (quadratischen) Gleichungssystem für die Entwicklungskoeffizienten der diskreten Lösung uh bzgl. einer geeignet gewählten Basis des Ansatzraumes Vh .
Sind die Funktionen in Vh stückweise polynomial bzgl. einer Zerlegung des Gebiets Ω z.B. in
Dreiecke oder Vierecke gewählt, liegt eine sog. Finite-Elemente-Methode“ vor. Diese Methoden
”
werden unten sehr ausführlich behandelt.
1 Theorie partieller Differentialgleichungen
In diesem Kapitel wird eine Einführung in die Theorie der partiellen Differentialgleichungen
gegeben, soweit sie für deren numerische Behandlung relevant ist. Wir betrachten zunächst
lineare Differentialgleichungen zweiter Ordnung der Form
Lu := −
d
X
aij ∂i ∂j u +
d
X
aj ∂j u + au = f,
(1.0.1)
j=1
i,j=1
mit gegebenen Koeffizientenfunktionen aij , aj , a und rechter Seite f . Wenn diese Funktionen
nicht zusätzlich von der unbekannten Lösung u abhängen, nennt man die Gleichung linear“.
”
Wegen der Vertauschbarkeit der Reihenfolge der Ableitungen kann o.B.d.A. aij = aji angenommen werden. Für allgemeine nichtlineare Gleichungen
F (x, u, ∇u, ∇2 u) = 0
(1.0.2)
gibt es keine einheitliche Lösungstheorie. Wir beschränken uns im folgenden daher im wesentlichen auf lineare Probleme.
Differentialgleichungen werden in der Regel auf (beschränkten oder halbbeschränkten) Gebieten Ω ⊂ Rd betrachtet. Dazu kommen dann noch Bedingungen entlang des Randes ∂Ω. Die
geeignete Wahl dieser Randbedingungen“ ist eine sehr delikate Sache und erfordert eingehende
”
Berücksichtigung der speziellen Eigenschaften des Differentialoperators. Diesen wird der nächste
Abschnitt gewidmet sein.
Damit eine Differentialgleichung mit den zugehörigen Randbedingungen ein sinnvolles Modell
eines realen physikalischen Vorgangs ist, sind eine Reihe von Forderungen zu stellen:
i) Existenz von Lösungen in einem möglicherweise verallgemeinerten Sinne; unter einer klassi”
schen“ Lösung versteht man eine solche, für die alle auftretenden Ableitungen im Gebietsinnern
im strengen Sinne definiert sind und die bis an den Rand stetig ist, d.h.: u ∈ C 2 (Ω) ∩ C(Ω).
ii) Eindeutigkeit der Lösungen möglicherweise unter Hinzunahme von weiteren physikalisch motivierten Bedingungen.
iii) Stetige Abhängigkeit von den Daten wegen der meist inexakten Verfügbarkeit von Koeffizienten und Randdaten in den physikalischen Modellen; Lösungen sollten sich unter kleinen
Datenstörungen auch nur wenig ändern.
Eine Aufgabe, welche diesen Minimalforderungen genügt, nennt man wohl-gestellt“ (im Sinne
”
von Hadamard1 ).
Bei Anfangs- oder Randwertaufgaben gewöhnlicher Differentialgleichungen war die Regularität der Lösung kein besonderes Thema, da sich die Regularität der Daten direkt auf die
entsprechende der Lösung überträgt. Bei partiellen Differentialgleichungen ist dies nicht immer
der Fall und bedarf für verschiedene Typen von Differentialgleichungen gesonderter Untersuchung.
1
Jacque Salomon Hadamard (1865-1963): französischer Mathematiker; Prof. in Bordeaux und Paris; viele
wichtige Beiträge zur komplexen Analysis und speziellen Funktionen, zur analytische Zahlentheorie, zur Variationsrechnung und zu den Differentialgleichungen der mathematischen Physik.
9
10
Theorie partieller Differentialgleichungen
1.1 Typeneinteilung
Partielle Differentialgleichungen lassen sich in drei Haupttypen einteilen: die elliptischen“, die
”
parabolischen“ und die hyperbolischen“ Gleichungen. Wir werden das dieser Unterteilung
”
”
zugrunde liegende Prinzip anhand einer leicht überschaubaren Situation erläutern. Dies sind die
linearen, skalaren Gleichungen 2. Ordnung in zwei Variablen:
Lu = a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u + a1 ∂x u + a2 ∂y u + au = f
mit konstanten Koeffizienten aij . Dabei sollen nicht alle drei Koeffizienten a11 , a12 , a22 der
Ableitungen zweiter Ordnung gleichzeitig Null sein. Diese Gleichung wird auf einem Gebiet
Ω ⊂ R2 betrachtet.
Ausgangspunkt ist ein direkter Lösungsansatz, wie er auch bei gewöhnlichen Differentialgleichungen angewendet werden kann. Für die Anfangswertaufgabe
u′ (t) = f (t, u(t)),
t ≥ 0,
u(0) = u0 ,
erhält man aus der Vorgabe u(0) = u0 durch sukzessives Differenzieren von f (t, x) Formeln für
alle Ableitungen von u :
u(i) (0) =
di−1
f (0, u0 ) =: f (i−1) (0, u0 ),
dti−1
i = 1, 2, 3, ... .
Wenn die Ableitungen f (i−1) nicht zu schnell wachsen (für f (t, x) = sin(x) sind sie z.B.
gleichmäßig beschränkt), konvergiert die Taylor2 -Reihe
u(t) = u0 +
∞ i
X
t
i=1
i!
f (i−1) (0, u0 )
für alle t ≥ 0 absolut und stellt die (eindeutige) Lösung der Anfangswertaufgabe dar.
y
Ω
n
Γ
x
Abbildung 1.1: Konfiguration der allgemeinen partiellen Differentialgleichung
2
Brook Taylor (1685-1731): englischer Mathematiker und Schüler Newtons; die nach ihm benannte Reihenentwicklung war im Kern bereits Gregory, Newton, Leibniz und Johann Bernoulli bekannt.
1.1 Typeneinteilung
11
Wir versuchen, diese Konstruktion auf partielle Differentialgleichungen zu übertragen. Dazu
sei Γ ein Jordan3 -Kurvenstück in Ω mit beliebig oft differenzierbarer Parametrisierung Γ =
{(x(τ ), y(τ )), τ ∈ [0, 1]} . Entlang Γ seien für die Lösung u(x, y) der Differentialgleichung die
Funktionswerte u sowie ihre Ableitungen ∂n u in Normalenrichtung n zu Γ vorgegeben. Dies
entspricht der Tatsache, daß wir es mit einer Differentialgleichung 2. Ordnung zu tun haben.
Mit u und ∂n u ist der ganze Gradient ∇u = (∂x u, ∂y u)T entlang Γ bekannt. Wir wollen
versuchen, aus diesen Vorgaben alle weiteren Ableitungen von u entlang Γ zu bestimmen, um
damit wieder einen Taylor-Reihenansatz für u in einer Umgebung von Γ zu machen. Zu diesem
Zweck führen wir die Abkürzungen ein:
p := ∂x u,
q := ∂y u,
r := ∂x2 u,
s := ∂x ∂y u,
t := ∂y2 u.
Differentiation von p und q entlang Γ , d.h. bzgl. des Parameters τ , ergibt
∂τ p = ∂x p∂τ x + ∂y p∂τ y = r∂τ x + s∂τ y,
∂τ q = ∂x q∂τ x + ∂y q∂τ y = s∂τ x + t∂τ y.
mit den bekannten tangentialen Ableitungen ∂τ x und ∂τ y entlang Γ. Zusammen mit der Differentialgleichung Lu = f ergibt dies ein 3 × 3-Gleichungssystem für die drei gesuchten Ableitungen r, s, t:
a11 r + 2a12 s + a22 t = f − a1 p − a2 q − au
∂τ xr + ∂τ ys
= ∂τ p
∂τ xs + ∂τ yt = ∂τ q
mit entlang Γ bekannter rechter Seite. Die Determinante der Koeffizientenmatrix B erhält man
durch Entwicklung nach der ersten Zeile zu
det B = a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 .
Wir unterscheiden jetzt zwei Fälle.
i) Fall det B 6= 0 entlang ganz Γ:
In diesem Fall sind alle zweiten Ableitungen r, s, t von u durch Vorgabe von u, ∂n u entlang
Γ (eindeutig) bestimmbar. Durch weitere Differentiation des Gleichungssystems nach x und y
erhält man wieder ein System für die dritten Ableitungen ∂x r, ∂x s, ∂x t sowie ∂y r, ∂y s, ∂y t jeweils
mit derselben Koeffizientenmatrix. Durch weiteres Differenzieren lassen sich so alle höheren
Ableitungen von u entlang Γ bestimmen. Durch den Reihenansatz
u(x, y) =
X (x − x0 )i (y − y0 )j
∂xi ∂yj u(x0 , y0 )
(i + j)!
i+j≥0
bzgl. eines Punktes (x0 , y0 ) ∈ Γ erhält man dann in einer Umgebung der Kurve Γ eine Lösung
der Differentialgleichung, die auf Γ die vorgegebenen Werte annimmt. Diese nennt man Lösung
der Cauchyschen4 Anfangswertaufgabe“ der Differentialgleichung bzgl. der Anfangskurve“ Γ.
”
”
3
Marie Ennemond Camille Jordan (1838-1922): französischer Mathematiker; Prof. in Paris; Beiträge zur Algebra, Gruppentheorie, Analysis und Topologie.
4
Augustin Louis Cauchy (1789-1857): Ingenieur, Physiker und bedeutendster französischer Mathematiker seiner
Zeit; wirkte an der École Polytechnique und der Sorbonne in Paris; gilt als Begründer der modernen Analysis und
12
ii) Fall det B = 0 in einem Punkt (x0 , y0 ) ∈ Γ:
Die quadratische Gleichung
a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 = 0
bestimmt gewisse Richtungen ∂τ y/∂τ x = dy/dx bzw. ∂τ x/∂τ y = dx/dy von Kurven (mit
Graph y = y(x) oder x = x(y) ) durch den Punkt (x0 , y0 ). Zu deren Bestimmung sei etwa
angenommen, daß a11 6= 0 und ∂τ x 6= 0. Dann besitzt die Gleichung
dy 2
dx
die Lösungen
dy dx
+/−
−
=
2a12 dy a22
+
=0
a11 dx
a11
a12
1
±
a11 a11
q
a212 − a11 a22 .
Diese entsprechen Steigungen von Kurven durch den Punkt (x0 , y0 ) ∈ Γ , entlang welcher die
höheren Ableitungen von u sich nicht aus den Vorgaben entlang Γ bestimmen lassen. Entlang
dieser kritischen, auch charakteristisch“ genannten Kurven (sog. Charakteristiken“ des Dif”
”
ferentialoperators L) läßt sich also die Lösung der Differentialgleichung nicht aus den obigen
Vorgaben konstruieren. Entlang solcher Kurven können Unstetigkeiten in der Lösung oder ihres Gradienten auftreten. Es ist also sehr wichtig, die Existenz von Charakteristiken und deren
Gestalt für den zu betrachtenden Differentialoperator vor Ansatz eines numerischen Verfahrens genau zu bestimmen. Offensichtlich hängt die Existenz von Charakteristiken allein von
den Koeffizienten der höchsten Ableitungen des Operators L , d.h. seinem sog. Hauptteil“
”
a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u , ab. Diesem wird die quadratische Form
q(x, y) := a11 x2 + 2a12 xy + a22 y 2
zugeordnet. Die Gleichung q(x, y) = 0 beschreibt Kegelschnitte in der (x, y)-Ebene:

< 0 :
2
a12 − a11 a22 = 0 :

>0:
Ellipse,
P arabel,
Hyperbel.
Von dieser rein formalen Charakterisierung stammen die obigen Bezeichnungen für die drei
Typen von partiellen Differentialgleichungen. Die Klassifikation eines Differentialoperators als
elliptisch“, parabolisch“ oder hyperbolisch“ wird für jeden einzelnen Punkt (x0 , y0 ) sepa”
”
”
rat vorgenommen. Im Falle variabler Koeffizienten aij = aij (x, y) oder im nichtlinearen Fall
aij (u(x, y)) kann der Typ einer Gleichung also im Lösungsgebiet wechseln. Wir werden im folgenden nur Gleichungen eines einheitlichen Typs betrachten; in vielen Anwendungen spielt aber
gerade der Typwechsel eine wichtige Rolle.
Als nächstes wollen wir die prototypischen Vertreter von (linearen) elliptischen, parabolischen und hyperbolischen Differentialgleichungen ableiten. Dies wird uns erneut auf die obige
Typenunterteilung führen. Dazu schreiben wir den Hauptteil L0 des Differentialoperators in
der Funktionentheorie.
1.1 Typeneinteilung
13
Matrix-Vektor-Form:
L0 =
a11 ∂x2
+ 2a12 ∂x ∂y +
a22 ∂y2
=
∂x
∂y
!T
a11 a12
a21 a22
!
∂x
∂y
!
= ∇T A∇
Die symmetrische Matrix A besitzt zwei reelle Eigenwerte λ, µ und ein zugehöriges Orthonormalsystem von Eigenvektoren {ξ, η} . Mit der Spaltenmatrix Q := [ξ, η] gilt
QQT = I,
QT AQ = D = diag(λ, µ).
Damit können wir schreiben:
L0 = ∇T QDQT ∇ = (QT ∇)T D(QT ∇)
!T
!
!
ξ1 ∂x + ξ2 ∂y
λ 0
ξ1 ∂x + ξ2 ∂y
=
0 µ
η1 ∂x + η2 ∂y
η1 ∂x + η2 ∂y
bzw.
L0 = λ(ξ1 ∂x + ξ2 ∂y )2 + µ(η1 ∂x + η2 ∂y )2 ,
oder mit den Richtungsableitungen ∂ξ = ξ · ∇ und ∂η = η · ∇ :
L0 = λ∂ξ2 + µ∂η2 .
Die Eigenwerte erhält man als Nullstellen des charakteristischen Polynoms
det(A − zI) = (a11 − z)(a22 − z) − a212 = z 2 − (a11 + a22 )z + a11 a22 − a212
= (z − λ)(z − µ) = z 2 − (λ + µ)z + λµ.
Durch Koeffizientenvergleich findet man ( Vietascher5 Wurzelsatz).
”
λ + µ = a11 + a22 ,
λµ = a11 a22 − a212 .
a) Elliptischer“ Fall a212 − a11 a22 < 0 :
”
Beide Eigenwerte λ, µ sind ungleich Null und haben dasselbe Vorzeichen. Die Lösungen der
charakteristischen Gleichung sind nicht reell, d.h.: Es existieren keine charakteristischen Kurven
durch den Punkt (x0 , y0 ). In diesem Fall ist der Konstruktionsprozeß für die höheren Ableitungen
von u durchführbar. Die Normalform eines elliptischen Operators L ist im Fall λ = µ = 1 :
Lu = ∂ξ2 u + ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u)
Der Hauptteil“ dieses Operators ist also gerade der Laplace-Operator“ ∆ , der sich somit als
”
”
prototypischer Vertreter elliptischer Differentialoperatoren 2. Ordnung erweist. Wir werden uns
daher im Folgenden hauptsächlich mit der zugehörigen Poisson-Gleichung beschäftigen:
∂x2 u + ∂y2 u = f.
(1.1.3)
5
Francois Viete, lat. Franciscus Vieta (1540-1603): französischer Mathematiker; Arbeiten über algebraische
Gleichungen und sphärische Trigonometrie; gab trigonometrische Tafeln heraus und führte die systematische
Buchstabenrechnung ein.
14
b) Parabolischer“ Fall: a212 − a11 a22 = 0
”
Einer der Eigenwerte ist Null; der zweite ist dann notwendig ungleich Null. Es existiert genau
eine charakteristische Richtung im Punkt (x0 , y0 ) mit der Steigung dy/dx = a12 /a11 . Die
Normalform eines parabolischen Operators L ist im Fall λ = 1, µ = 0 :
Lu = ∂ξ2 u + ψ(ξ, η, u, ∂ξ u, ∂η u).
Der Hauptteil dieses Operators ist im linearen Fall gerade der sog. Wärmeleitungsoperator“,
”
der prototypische Vertreter parabolischer Differentialoperatoren 2. Ordnung. Wir werden uns
daher im folgenden mit der zugehörigen Wärmeleitungsgleichung beschäftigen:
∂t u − ∂x2 u = f.
(1.1.4)
c) Hyperbolischer“ Fall: a212 − a11 a22 > 0
”
Beide Eigenwerte sind ungleich Null, haben aber verschiedene Vorzeichen. Es existieren zwei
charakteristische
Richtungen im Punkt (x0 , y0 ) mit den Steigungen (dy/dx)± = a12 /a11 ±
p
−1
2
a11 a12 − a11 a22 . Die Normalform eines hyperbolischen Differentialoperators L ist im Fall
λ = 1, µ = −1 :
Lu = ∂ξ2 u − ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u).
Der Hauptteil dieses Operators ist der sog. Wellenoperator“, der prototypische Vertreter hy”
perbolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der
zugehörigen Wellengleichung beschäftigen:
∂t2 u − ∂x2 u = f.
(1.1.5)
Wir haben gesehen, daß die Cauchysche Anfangswertaufgabe“ durch Reihenansatz lösbar
”
ist, wenn die Anfangskurve“ Γ nirgends mit einer Charakteristik des Differentialoperators
”
zusammenfällt. Andernfalls kann die Situation eintreten, daß zu beiden Seiten der Kurve Γ
eine Lösung existiert, diese aber nicht auf Γ stetig-differenzierbar fortsetzbar ist. Im folgenden
werden wir die für die drei Gleichungstypen geeigneten Randbedingungen diskutieren und dabei
ganz unterschiedliche Ergebnisse erhalten.
1.2 Elliptische Probleme
15
Wir haben gesehen, daß für (im ganzen Lösungsgebiet Ω ) elliptische Differentialoperatoren die
Cauchysche Anfangswertaufgabe“ für jede (analytische) Anfangskurve“ Γ ⊂ Ω lösbar ist. Die
”
”
Verallgemeinerung dieser Aussage für nichtlineare Differentialoperatoren der Art
L(u) = ∂x2 u − F (x, y, u, ∂x u, ∂y u, ∂y2 u)
(1.2.6)
ist der berühmte Satz von Cauchy-Kovalevskaya6 Dieser sehr allgemeine Existenzsatz für elliptische Differentialgleichungen ist aber für die Praxis nur von geringer Bedeutung. Die über
einen lokalen Reihenansatz konstruierte Lösung u hängt nämlich i.a. nicht stetig von den vorgegebenen Anfangswerten entlang Γ ab. Dies ist aber eine unverzichtbare Bedingung an ein
physikalisch sinnvolles Modell.
Beispiel: In der Halbebene Ω = {(x, y) ∈ R2 : x > 0} seien entlang der Randkurve Γ =
{(0, y) ∈ R2 } die Randwerte u(0, y) = u00 (y) = 0, ∂x u(0, y) = u10 (y) = 0 gegeben. Die zugehörige Lösung der Poisson-Gleichung ∆u = 0 ist u ≡ 0. Mit ε > 0 seien die Randdaten nun gestört
zu
u0ε (y) = 0, u1ε (y) = ε sin(y/ε),
wobei limε→0 u1ε (y) = 0 . Die zugehörige gestörte Lösung der Poisson-Gleichung (nachrechnen!)
uε (x, y) = ε2 sin(y/ε) sinh(x/ε),
sinh(z) = 12 (ez − e−z ),
konvergiert aber für ε → 0 nicht gegen Null. Es zeigt sich, daß in diesem Fall entlang der
Anfangskurve Γ nicht gleichzeitig Werte für u und ∂n u vorgegeben werden dürfen, wenn man
an physikalisch sinnvollen Lösungen interessiert ist.
Wir haben gesehen, daß man bei der Wahl von Randbedingungen für elliptische Operatoren
vorsichtig sein muß, wenn das resultierende Randwertproblem wohl-gestellt sein soll. Sei also
Ω ⊂ R2 ein beschränktes Gebiet mit hinreichend glattem Rand ∂Ω. Wir wollen dabei Ränder
mit einer glatten Parametrisierung (mindestens zweimal stetig differenzierbar) oder ein Polygongebiet (mit endlich vielen Ecken) zulassen. Als prototypischen Modellfall betrachten wir die
Poisson-Gleichung“
”
−∆u = f
auf Ω.
(1.2.7)
Es gibt drei Typen von Randbedingungen und zugehörige Randwertaufgaben ( RWAn“):
”
7
a) Dirichletsche Randbedingungen ( 1. RWA“): u = g auf ∂Ω .
”
6
Sofia Vasilyevna Kovalevskaya (1850-1891): russische Mathematikerin, eine der ersten Frauen mit Universitätskarriere; 1869 Studium in Heidelberg als “Gasthörerin”, da hier für Frauen ein offizielles Universitätsstudium noch nicht möglich war; ab 1871 Studium in Berlin bei Weierstraß und danach in Göttingen; eine ihrer
ersten Veröffentlichungen enthält den nach ihr benannten “Existenzsatz”; konnte damals als Frau aber keine Universitätsanstellung in Deutschland bekommen, trotz Fürsprache von Weierstraß; auf Betreiben Mittag-Lefflers
ab 1884 Stelle als “Privatdozent” in Stockholm; leistete Beiträge zur Analysis und zur Theorie von Differentialgleichungen der Physik; Anekdotisches: In ihrer Autobiografie steht, daß sie bereits als 11-Jährige durch die
Lektüre von Seiten aus Ostrogradskis Vorlesungskriptum über Differential- und Integralrechnung, mit denen ihr
Kinderzimmer tapeziert war, mit der Analysis in Berührung gekommen war.
7
Johann Peter Gustav Lejeune Dirichlet (1805-1859) geb. in Düren (damals bei Frankreich): wirkte in Berlin
und als Prof. in Göttingen (Nachfolger von Gauß ); wichtige Beiträge zur Zahlentheorie, Analysis und Differentialgleichungen (“Dirichletsches Prinzip”).
16
b) Neumannsche8 Randbedingungen ( 2. RWA“): ∂n u = g auf ∂Ω .
”
9
c) Robinsche Randbedingungen ( 3. RWA“): ∂n u + αu = g auf ∂Ω .
”
Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese RWAn sind, wie
wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten wohl gestellt.
n
Ω
Ω
Abbildung 1.2: Konfiguration der elliptischen Randwertaufgabe
1.2.1 Existenz
Die Frage nach der Existenz von Lösungen der 1. RWA ist wesentlich schwieriger als bei AWAn
gewöhnlicher Differentialgleichungen. Als Vorbereitung für analoge Argumente im Zusammenhang mit den Diskretrisierungsverfahren wollen wir zwei völlig unterschiedliche Zugänge zu
dieser Frage diskutieren, den klassischen“, potentialtheoretischen und den modernen“, funk”
”
tionalanalytischen. Der Einfachheit halber wird nur der Fall homogener“ Randbedingungen
”
u|∂Ω = 0 betrachtet.
i) Potentialtheoretische Methode:
Zunächst ist der Begriff einer klassischen“ Lösung für die Dirichletschen Randbedingung zu
”
präzisieren. Wir verstehen darunter eine Funktion u ∈ C 2 (Ω) ∩ C(Ω), welche im Innern von
Ω der Differentialgleichung und entlang des Randes ∂Ω der Randbedingung genügt. Ferner
soll ihr Gradient (möglicherweise im uneigentlichen Riemannschen10 Sinne) quadratintegrabel
sein: |∇u| ∈ L2 (Ω). Zur Konstruktion solcher klassischer Lösungen postulieren wir zunächst die
Existenz einer Funktion G(x, y) auf Ω × Ω ,
G ∈ C 2 ({Ω × Ω} \ {x = y}) ∩ C({Ω × Ω} \ {x = y}),
8
John von Neumann (1903-1957): US-amerikanischer Mathematiker ungarischer Abstammung; wirkte
hauptsächlich am Institute for Advanced Studies in Princeton (zus. mit A. Einstein u.a.) und gilt als mathematisches Genie; lieferte fundamentale Beiträge zu den mathematischen Grundlagen der Quantenmechanik, zur
Operatortheorie, zur Spieltheorie, zur Gruppentheorie und zur Theorie der partiellen Differentialgleichungen;
Pionier der Automatentheorie und theoretischen Informatik.
9
Victor Gustave Robin (1855-1897: französischer Mathematiker; lehrte an der Sorbonne in Paris; Beiträge zur
Potentialtheorie unf Thermodynamik; hat die nach ihm benannte 3. Randbedingung anscheinend selbst gar nicht
benutzt.
10
Bernhard Riemann (1826-1866): deutscher Mathematiker; Professor in Göttingen als Nachfolger Dirichlets;
Mitbegründer der Funktionentheorie und der modernen Geometrie; einer der bedeutendsten Mathematiker des
19. Jh.s, von großem Einfluß auch auf die theoretische Physik.
17
mit den Eigenschaften
−∆x G(·, y) = 0 in Ω \ {y},
G(·, y) = 0
auf ∂Ω \ {y},
(1.2.8)
für beliebiges festes y ∈ Ω . Für x = y habe G(x, y) eine dimensionsabhängige Singularität, die
so beschaffen ist, daß sich −∆x G(·, y) wie die Dirac-Distribution verhält, d.h.: Für v ∈ C(Ω)
gilt mit den Kugelumgebungen Bε := {y ∈ Ω : |x| ≤ ε} , ε > 0 :
Z
x ∈ Ω : lim
−∆x G(x, y) v(y) dy = v(x),
(1.2.9)
ε→0 Ω\Bε
Z
x ∈ ∂Ω : lim
∂n G(x, y) v(y) dy = v(x).
(1.2.10)
ε→0
∂Ω\Bε
Eine solches G(x, y) wird Greensche Funktion (1. Art)“ genannt. Wir machen damit den
”
Lösungsansatz
Z
Z
∂n G(x, y)g(y) doy .
G(x, y)f (y) dy +
u(x) :=
Ω
∂Ω
Die formulierten Eigenschaften der Greenschen Funktion erlauben es, zu zeigen, daß dieser Ansatz tatsächlich eine klassische Lösung der 1. RWA liefert. Diese Rechnung ist aufwendig und
kann z.B. im Buch von Hellwig nachgelesen werden. Die Konstruktion einer Greenschen Funktion für allgemeine Gebiete im Rd ist schwer. Im Fall d = 2 folgt ihre Existenz aber mit Hilfe des
Riemannschen Abbildungssatzes aus der Theorie komplexer Funktionen (siehe Hellwig). Für sehr
spezielle Konfigurationen, wie z.B. Halbebenen oder Kreise, läßt sich die Greensche Funktion
explizit angeben.
Beispiel: Auf dem Kreis Ω := {x ∈ R2 : |x| < R} ist durch
o
R
R2
1 n
log(|x − y|) + log( ) − log(| 2 x − y|) ,
2π
|x|
|x|
o
1 n
log(|y|) − log(R) , x = 0.
G(x, y) = −
2π
G(x, y) = −
x 6= 0,
(1.2.11)
(1.2.12)
eine Greensche Funktion mit den obigen Eigenschaften gegeben.
Die Existenz Greenscher Funktionen läßt sich für sehr allgemeine Gebiete Ω nachweisen,
auch für die anderen RWAn. Das Konzept der klassischen“ Lösung ist in vielen Anwendungsfällen
”
zu restriktiv, z.B. wenn die rechte Seite f nicht regulär genug ist, um eine C 2 -Lösung zuzulassen. Die Greensche Funktion selbst ist ein Extremfall in dieser Hinsicht. Als nächstes werden
wir eine Abschwächung dieser Anforderungen kennenlernen, welche mehr Flexibilität bietet und
für die man vergleichweise leicht die Existenz von Lösungen garantieren kann.
ii) Funktionalanalytische Methode:
Wir haben bereits früher gesehen, daß eine enge Beziehung zwischen der Poisson-Gleichung und
der Minimierung des zugehörigen Energiefunktionals besteht. Dies kann man zum Nachweis der
Existenz von Lösungen ausnutzen. Wir betrachten das Funktional
Z
Z
1
2
f v dx
E(v) :=
|∇v| dx −
2 Ω
Ω
18
auf dem Vektorraum Ṽ der zulässigen“ Funktionen:
”
Ṽ0 := {v : Ω → R : v ∈ C 1 (Ω) ∩ C(Ω), v|∂Ω = 0, |∇v| ∈ L2 (Ω)}.
Dieser Raum wird mit der natürlichen Energie-Norm“
”
kvkE := k∇vkΩ ,
v ∈ Ṽ0 ,
versehen. Daß dies wirklich eine Norm ist, folgt aus den entsprechenden Eigenschaften der L2 Norm k · k = k · kΩ . Aus der Poincaréschen Ungleichung
kvkΩ ≤ dΩ k∇vkΩ ,
v ∈ Ṽ0 ,
mit dΩ := diam(Ω) folgt weiter, daß diese Norm stärker ist als die L2 -Norm. In kompakter
Schreibweise ist E(v) = 12 k∇vk2 − (f, v). Wir verwenden jetzt eine Argumentation aus der
Variationsrechnung, die dort als die direkte Methode“ bekannt ist.
”
i) Wir zeigen zunächst, daß E(·) nach unten beschränkt ist. Für v ∈ Ṽ0 folgt mit Hilfe der
Hölderschen und der Poincaréschen Ungleichung
E(v) ≥ 12 k∇vk2 − kf k kvk ≥ 12 k∇vk2 − dΩ kf k k∇vk.
Anwendung der Ungleichung ab ≤ 12 a2 + 21 b2 liefert weiter
dΩ kf k k∇vk ≤ 12 k∇vk2 + 12 d2Ω kf k2 ,
und folglich
E(v) ≥ − 12 d2Ω kf k2 > −∞,
v ∈ Ṽ0 .
ii) Sei nun (uk )k∈N ⊂ Ṽ0 eine Minimalfolge“ des Funktionals E(·) , d.h.:
”
E(uk ) → inf E(v) =: d > −∞.
v∈Ṽ
Wir wollen zeigen, daß (uk )k∈N eine Cauchy-Folge bzgl. der Energie-Norm ist. Wichtiges Hilfsmittel dazu ist die sog. Parallelogrammidentität“
”
kv − wk2E + kv + wk2E = 2kvk2E + 2kwk2E ,
die man durch direktes Nachrechnen verifiziert. Für beliebige Indizes n, m ∈ N gilt folglich
kun − um k2E = 2kun k2E + 2kum k2E − 4k 12 (un + um )k2E
= 4E(un ) + 4(f, un ) + 4E(um ) + 4(f, um ) − 8E( 12 (un + um ))
− 8(f, 12 (un + um ))
= 4E(un ) + 4E(um ) − 8E( 21 (un + um )).
Wegen
lim {E(un ) + E(um )} = 2d,
n,m→∞
E( 12 (un + um )) ≥ d,
folgt damit
lim sup kun − um k2E ≤ 0,
n,m→∞
19
d.h.: (un )n∈N ist wie behauptet eine Cauchy-Folge.
Die Cauchy-Folge (un )n∈N besitzt i.a. keinen Limes im normierten (unvollständigen) Raum
Ṽ0 . Durch Vervollständigung von Ṽ0 erhält man den sog. Sobolew-Raum“ H01 (Ω). Die Ele”
mente von H01 (Ω) sind zunächst als Äquivalenzklassen von Cauchy-Folgen (analog wie bei der
Konstruktion der reelen Zahlen aus den rationalen) definiert; sie lassen sich aber wieder als Funktionen interpretieren. Sie sind L2 -Funktionen, deren erste Ableitungen (im Distributionssinne)
wieder in L2 liegen und die in einem abgeschwächten Sinn auf ∂Ω verschwinden (siehe die angegebene Literatur zur Theorie partieller Differentialgleichungen). Wir werden unten in Abschnitt
1.3 die Eigenschaften dieser Sobolew11 -Räume“ genauer diskutieren. Der Limes u ∈ H01 (Ω)
”
der Folge (un )n∈N wird als die schwache“ oder auch variationelle“ Lösung der 1. RWA des
”
”
Laplace-Operators bezeichnet. Als Minimalpunkt des Funktionals E(·) genügt sie, wie wir schon
früher gesehen haben, notwendig der Beziehung
(∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.2.13)
Umgekehrt gilt für eine Funktion u ∈ H01 (Ω) , welcher dieser Variationsgleichung genügt, mit
jeder anderen Funktion v ∈ H01 (Ω)
E(v) − E(u) = 12 k∇vk2 − (f, v) − 12 k∇uk2 + (f, u)
= 21 k∇vk2 − (∇u, ∇v) − 12 k∇uk2 + (∇u, ∇u)
= 12 k∇vk2 − (∇u, ∇v) + 12 k∇uk2 = 21 k∇(v − u)k2 ≥ 0.
Folglich ist u automatisch auch Minimum des Energiefunktionals und somit schwache Lösung.
Wenn die schwache Lösung u regulärer ist, etwa sogar die Regularität einer klassischen
Lösung besitzt, so kann partiell integriert werden, und wir finden
(−∆u, ϕ) + (∂n u, ϕ)∂Ω = (f, ϕ)
∀ϕ ∈ H01 (Ω)
bzw. wegen der Randbedingung ϕ|∂Ω = 0
(−∆u − f, ϕ) = 0
∀ϕ ∈ H01 (Ω).
Hieraus folgt mit den üblichen Argumenten, daß −∆u = f , d.h.: u ist sogar klassische Lösung
der RWA. Umgekehrt erfüllt natürlich jede klassische Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω̄) die Variationsgleichung
(∇u, ∇ϕ) − (f, ϕ) = (−∆u − f, ϕ) + (∂n u, ϕ)∂Ω = 0 ∀ϕ ∈ H01 (Ω).
Damit ist der schwache“ Lösungsbegriff verträglich mit dem ursprünglichen klassischen“. Der
”
”
Nachweis höherer Regularität der schwachen Lösung u ∈ H01 (Ω) ist allerdings schwierig und
kann im Rahmen dieser Vorlesung nur andiskutiert werden (siehe wieder die empfohlene Literatur).
Wir wollen noch kurz diskutieren, wie das obige Argument verwendet werden kann, um die
11
Sergei Lvovich Sobolew (1908-1989): russischer Mathematiker; wirkte zunächst in Leningrad (St. Petersburg)
und dann am berühmten Steklov-Institut für Mathematik der Akademie der Wissenschaften in Moskau; fundamentale Beiträge zur Theorie der partiellen Differentialgleichungen, Konzept der verallgemeinerten (distributionellen)
Lösung, Sobolew-Räume; beschäftigte sich auch mit numerischen Methoden, numerische Quadratur.
20
Existenz von schwachen Lösungen der 1. RWA auch im Fall inhomogener Randdaten u|∂Ω = g
zu sichern. Dazu nehmen wir an, daß die Randfunktion g als Spur“ einer auf ganz Ω definierten
”
Funktion ĝ ∈ C 2 (Ω) ∩ C(Ω) gegeben ist, d.h.: g = ĝ|∂Ω . Dann wäre die Funktion v := u − ĝ
Lösung der RWA
−∆v = f − ∆ĝ in Ω, v|∂Ω = 0.
Hierfür garantiert nun die variationelle Methode die Existenz einer (eindeutigen) schwachen
Lösung v ∈ H01 (Ω) mit der Eigenschaft
(∇v, ∇ϕ) = (f, ϕ) + (∇ĝ, ∇ϕ)
∀ϕ ∈ H01 (Ω).
Die schwache Lösung der ursprünglichen RWA ergibt sich dann als u := v + ĝ .
1.2.2 Eindeutigkeit
Die Eindeutigkeitsforderung an Lösungen dieser RWAn ist leicht zu gewährleisten. Wir diskutieren hier nur die 1. RWA. Die entsprechenden Argumente für die 2. und die 3. RWA seien als
Übung gestellt.
(i) Besonders einfach ist der Beweis für die schwachen Lösungen. Seien also u(1) , u(2) ∈ H01 (Ω)
zwei schwache Lösungen der 1. RWA, d.h.:
(∇u(i) , ∇ϕ) = (f (i) , ϕ)
∀ϕ ∈ H01 (Ω).
Dann gilt für die Differenz w := u(1) − u(2)
(∇w, ∇ϕ) = 0
∀ϕ ∈ H01 (Ω).
Mit ϕ := w folgt k∇wk = 0 und folglich w ≡ konst. bzw. w ≡ 0 wegen der Randbedingung.
(ii) Die Eindeutigkeit von klassischen Lösungen folgt unmittelbar aus der gerade bewiesenen
Eindeutigkeit von schwachen Lösungen, da jede klassische Lösung ja auch schwache Lösung ist.
Eine direktere Argumentation ergibt sich mit Hilfe des sog. Maximumprinzips“ .
”
Hilfssatz 1.1 (Maximumprinzip): Für den elliptischen Operator
Lu := −∆u + au
mit a ≥ 0 auf einem Gebiet Ω ∈ Rd gilt das sog. Maximumprinzip“, d.h.: Eine Funktion
”
u ∈ C 2 (Ω) ∩ C(Ω) mit der Eigenschaft Lu ≤ 0 hat in Ω kein positives Maximum. Dies
bedeutet, daß entweder u ≤ 0 auf ganz Ω ist, oder
max u ≤ max u.
Ω
∂Ω
(1.2.14)
Beweis: Wir führen den Beweis nur für den Fall, daß a > 0 auf Ω . Der allgemeine Fall
a ≥ 0 erfordert eine aufwendigere Argumentation (siehe z.B. das Buch von Hellwig). Ferner sei
d = 2. Angenommen, die Funktion u habe im Fall u 6≤ 0 in einem Punkt z ∈ Ω ein positives
Maximum, u(z) > 0. Dann ist notwendig
∇u(z) = 0,
∂x2 u(z) ≤ 0, ∂y2 u(z) ≤ 0.
21
Damit folgt 0 ≥ Lu(z) = −∆u(z)+au(z) ≥ au(z) , was wegen a > 0 den Widerspruch u(z) ≤ 0
erzwingt.
Q.E.D.
Das Maximumprinzip für elliptische Operatoren 2. Ordnung ist die natürliche Verallgemeinerung der simplen Tatsache, daß in einer Raumdimension aus u′′ (x) ≥ 0 die Konvexität von
u folgt.
y
u"(x) > 0
u(x)
Ω
x
Abbildung 1.3: Maximumprinzip in einer Dimension
Aussagen vom Typ des obigen Maximumprinzips lassen sich für sehr allgemeine (auch nichtlineare) elliptische Operatoren 2. Ordnung herleiten. Wir betonen, daß das Maximumprinzip i.a.
für elliptische Operatoren höherer Ordnung (z.B. den biharmonischen Operator“ ∆2 u ) und für
”
elliptische Systeme (z.B. die Gleichungen der linearen Elastizitätstheorie) nicht mehr gilt.
Als erste, einfache Anwendung des Maximumprinzips erhalten wir einen alternativen Beweis
für die Eindeutigkeit (klassischer) Lösungen der 1. RWA des Laplace-Operators. Sind u(1) , u(2)
zwei Lösungen, so gilt für die Differenz w := u(1) − u(2) wieder
−∆w = 0 in Ω,
w = 0 auf ∂Ω.
Anwendung des Maximumprinzips auf w sowie −w impliziert dann, daß notwendig w ≤
0, −w ≤ 0 , d.h.: w ≡ 0.
1.2.3 Stetige Abhängigkeit
(i) Die Frage nach der stetigen Abhängigkeit der Lösungen der 1. RWA wollen wir wieder
sowohl mit Hilfe des klassischen Ansatzes als auch mit der variationellen Methode angehen.
Seien zunächst u(1) , u(2) zwei Lösungen (klassisch oder variationell) der 1. RWA des LaplaceOperators zu unterschiedlichen rechten Seiten f (1) , f (2) . Für die Differenz w = u(1) − u(2) folgt
dann
k∇wk2 = (f (1) − f (2) , w) ≤ kf (1) − f (2) kΩ kwk.
Unter Ausnutzung der Poincaréschen Ungleichung folgt daraus
k∇wk ≤ dΩ kf (1) − f (2) k,
d.h. die Stetigkeit der Lösung (in der Energie-Norm) gegenüber Störungen der rechten Seite.
22
(ii) Als nächstes betrachten wir Störungen der Randdaten. Dazu verwenden wir wieder das
Maximumprinzip. Seien dazu u(1) , u(2) zwei Lösungen zu den Randdaten g(1) , g(2) . Für die
Differenz w := u(1) − u(2) gilt dann
−∆w = 0 in Ω,
w = g := g(1) − g(2) auf ∂Ω.
Mit dem Maximumprinzip erschließen wir hieraus, daß w ≡ 0 (was natürlich i.a. nicht eintritt)
oder
max w ≤ max g, max −w ≤ max −g.
∂Ω
Ω
Ω
∂Ω
Dies impliziert maxΩ |w| ≤ max∂Ω |g|.
Schließlich ergibt sich mit Hilfe des Maximumprinzips noch, daß eine Lösung der 1. RWA
des Laplace-Operators zu nichtnegativer rechter Seite und ebensolchen Randdaten,
−∆u ≥ 0 in Ω,
u ≥ 0 auf ∂Ω,
notwendig überall nicht-negativ ist: u ≥ 0 . Dies gilt dann z.B. auch für die zugehörige Greensche Funktion: g(·, ·) ≥ 0. Durch schärfere Argumente kann man darüber hinaus zeigen, daß die
Greensche Funktion im Innern des Definitionsgebiets Ω positiv ist. Dies bedeutet u.a., daß bei
einem elliptischen Problem lokale Störungen in den Daten die Lösung im gesamten Lösungsgebiet verändern. Es liegt also gewissermaßen eine unendliche Ausbreitungsgeschwindigkeit“ von
”
Information vor. Dies ist charakteristisch für elliptische Randwertaufgaben.
1.2.4 Regularität
Auf glatt berandeten Gebieten Ω besteht, ähnlich wie bei gewöhnlichen Differentialgleichungen,
für (lineare) partielle Differentialgleichungen vom elliptischen Typ die Regel, daß sich die Regularität der Daten (rechte Seite und Randwerte) auf natürliche Weise auf die Lösung überträgt.
Der Rand ∂Ω sei aus der Klasse C 2 (2-mal stetig differenzierbar parametrisierbar). Dann besitzt
die schwache Lösung u ∈ H01 (Ω) im Falle f ∈ L2 (Ω) zweite Ableitungen mit der Regularität
|∇2 u| ∈ L2 (Ω) , und es gilt die a priori Abschätzung
2
X
k=0
k∇k uk2
1/2
≤ ckf k.
(1.2.15)
Diese Aussage bleibt gültig, wenn Ω ein konvexes Polygongebiet oder ein konvexer Polyeder
ist. Ist darüber hinaus f Hölder-stetig, so ist die schwache Lösung u ∈ H01 (Ω) sogar klassische
Lösung. Höhere Regularitätseigenschaften von ∂Ω und f übertragen sich entsprechend auf u .
Im Fall von Gebieten mit Ecken, insbesondere einspringenden“ Ecken (Innenwinkel ω > π)
”
treten allerdings dort Irregularitäten in der Lösung auf; z. B. ist die in ebenen Polarkoordinaten
(r, θ) ausgedrückte Funktion
2
u(r, θ) = r 3 sin( 23 θ)
auf der gelochten Ebene R2 \ {0} harmonisch, d.h. ∆u ≡ 0 . Auf dem Tortenstück“
”
Ω := {(x, y) ∈ R2 | 0 < r < 1, 0 < θ < 32 π}
mit einer rechtwinkligen einspringenden Ecke ist ∇u ∈ L2 (Ω)2 , und u ist daher (klassische)
23
Lösung der Poisson-Gleichung ∆u = 0 zu den Randbedingungen
u(r, θ) = 0 für θ ∈ {0, 32 π},
u(r, θ) = sin( 32 ) für r = 1.
Wir sehen an diesem Beispiel, daß klassische“ Lösungen elliptischer Gleichungen nicht unbe”
dingt regulär bis zum Rand ∂Ω zu sein brauchen. Für allgemeinen Innenwinkel ω ∈ (0, 2π] (Der
Fall ω = 2π entpricht einem sog. Schlitzgebiet“.) erhält man analoge klassische Lösungen in
π
”
der Form u(r, θ) = r ω sin( ωπ θ) . Für ω > π , d.h. für eine einspringende“ Ecke hat die Lösung
”
bei r = 0 singuläre erste Ableitungen. Diese sog. Eckensingularitäten“ sind gut analysiert und
”
abschätzbar. Sie haben einen signifikanten, negativen Einfluß auf die Approximationsgüte von
Diskretisierungen und erfordern besondere Vorkehrungen.
24
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
In diesem Abschnitt stellen wir einige Aussagen über Räume verallgemeinert differenzierbarer
Funktionen, sog. Sobolew-Räume“, zusammen, soweit sie später bei der Analyse von Diskreti”
sierungsverfahren benötigt werden.
1.3.1 Sobolew-Räume
Sei Ω ein Gebiet im Rd (d = 2, 3) mit Rand ∂Ω . Der Rand wird als ausreichend“ glatt ange”
nommen, was von der betrachteten Situation abhängt; diesbezügliche Einschränkungen werden
von Fall zu Fall angegeben. Wir nehmen generell an, daß ∂Ω eine Lipschitz-stetige Parametrisierung besitzt und überall bis auf endlich viele Punkte oder Kanten eine wohl-definierte äußere
Normale n besitzt.
Auf einem solchen Gebiet Ω definieren wir zunächst für Funktionen aus C(Ω) (Vektorraum
der stetigen Funktionen auf dem Abschluß Ω ) das sog. L2 -Skalarprodukt und die zugehörige
Norm
Z
Z
u(x)v(x) dx,
(u, v)Ω :=
Ω
kuk0;Ω :=
Ω
|u(x)|2 dx
1/2
.
Wenn Verwechslungen ausgeschlossen sind, wird auch die kürzere Notation (·, ·) = (·, ·)Ω sowie
k · k = k · k0 = k · k0;Ω verwendet. Die Vervollständigung von C(Ω) bzgl. der Norm k · k0;Ω liefert den Lebesgueschen12 Hilbert-Raum“ L2 (Ω) der auf Ω im Lebesgueschen Sinne meßbaren
”
und quadratintegrablen Funktionen. Eine Funktion“ v ∈ L2 (Ω) ist dann dadurch charakte”
risiert, daß es eine Folge glatter Funktionen (vk )k∈N ⊂ C(Ω) gibt, welche bzgl. der L2 -Norm
Cauchy-Folge ist und fast überall“ (im Lebesgueschen Sinne) gegen v konvergiert. Mit einem
”
einfachen Approximationsargument läßt sich zeigen, daß sich L2 (Ω) auch als Vervollständigung
des Raumes der Testfunktionen“ (Begriff aus der Distributionen-Theorie)
”
C0∞ (Ω) := {v ∈ C ∞ (Ω) : Trg(v) := {x ∈ Ω, v(x) 6= 0} ⊂ Ω kompakt}
gewinnen läßt. Auf analoge Weise gewinnt man für 1 ≤ p < ∞ die sog. Lp -Räume“ Lp (Ω) als
”
Vervollständigung von C(Ω) bzgl. der Norm
Z
1/p
kvkLp (Ω) :=
|v(x)|p dx
.
Ω
Der Fall p = ∞ bedarf einer gesonderten Betrachtung. Der Lebesgue-Raum L∞ (Ω) besteht
aus allen auf Ω definierten, im Lebesgueschen Sinne meßbaren und wesentlich beschränkten“
”
Funktionen; seine Norm ist
kvkL∞ (Ω) := ess supx∈Ω |v(x)|.
Man beachte, daß sich L∞ (Ω) nicht als Vervollständigung von C(Ω) bzgl. der Norm k·k∞;Ω gewinnen läßt, denn dies ergibt wieder C(Ω) . Wenn Mißverständnisse ausgeschlossen sind, werden
die Lp -Normen auch kurz mit k · kp = k · kLp = k · kLp (Ω) bezeichnet.
Die funktionalanalytische Methode zum Nachweis der Existenz von schwachen“ Lösungen
”
12
Henri Léon Lebesgue (1875-1941): französischer Mathematiker, Professor am Collège de France in Paris,
lieferte grundlegende Beiträge zur modernen Integrationstheorie (“Lebesgue-Intgeral”)
25
der Poisson-Gleichung
−∆u = f in Ω,
u|∂Ω = 0,
(1.3.16)
bedient sich als natürlichen Lösungsraum“ des Sobolew-Raums H01 (Ω) . Dieser ist Teilraum
”
des Sobolew-Raums H 1 (Ω) , welchen man erhält z.B. durch Vervollständigung des Vektorraums
C 1 (Ω) bzgl. der sog. H 1 -Norm
kvk1 := kvk20 + k∇vk20
1/2
.
Entsprechend ist H01 (Ω) definiert als der Abschluß von C0∞ (Ω) in H 1 (Ω) .
Die Definition des Sobolew-Raums H 1 (Ω) als Vervollständigung von C 1 (Ω) besagt zunächst,
daß seine Elemente als Äquivalenzklassen von Cauchy-Folgen (vk )k∈N ⊂ C 1 (Ω) bzgl. der H 1 Norm definiert sind. Dies ist ein sehr unhandliches Konzept, mit dem man schlecht arbeiten
kann. Daher werden diesen Äquivalenzklassen Funktionen auf Ω zugeordnet durch folgende
Konstruktion:
{(vk )k∈N } 7→ v ∈ H 1 (Ω) :
v := lim vk ,
k→∞
∇v := lim ∇vk ,
k→∞
wobei die Konvergenz jeweils im L2 -Sinne zu verstehen ist. Umgekehrt existiert dann für jede
solche Funktion v ∈ H 1 (Ω) eine approximierende Folge glatter“ Funktionen (vk )k∈N mit kv −
”
vk k1 → 0 (k → ∞) . Auf diesem Wege, d.h. durch Konstruktion einer solchen approximierenden
Folge wird auch für eine gegebene Funktion v ∈ L2 (Ω) gegebenenfalls v ∈ H 1 (Ω) gezeigt. Die
Limiten ∂i v := limk→∞ ∂i vk werden verallgemeinerte“ (oder auch schwache“) Ableitungen
”
”
von v genannt. Sie sind i.a. nicht stetig oder beschränkt und existieren nur im L2 -Sinne, d.h.
im Lebesgueschen Sinn fast überall“. Zum Nachweis, daß eine in fast allen Punkten x ∈ Ω
”
definierte Funktion v in H 1 (Ω) liegt, geht man üblicherweise wie folgt vor: Zunächst wird
aus Kenntnis der Struktur von v eine Folge approximierender glatter“ Funktionen (vk )k∈N ⊂
”
C 1 (Ω) konstruiert, welche für k → ∞ samt ihrer ersten Ableitungen (fast überall) punktweise
gegen v konvergieren. Kann dann noch gezeigt werde, daß
lim kvk k1;Ω < ∞,
so folgt (nach dem Satz von der dominierten Konvergenz“ der Maß-Theorie), daß (vk )k∈N eine
”
Cauchy-Folge bzgl. der H 1 -Norm ist und den Limes v besitzt; d.h. v ∈ H 1 (Ω) .
Beispiel 1.1: (i) L2 -Funktionen: Sei Ω zunächst die gepunktete Kreisscheibe
Ω0 = {x ∈ R2 : 0 < |x| < 1}.
Auf Ω0 ist die Funktion u(x) = ln(|x|) stetig, aber unbeschränkt. Auf der vollen Kreisscheibe
Ω = {x ∈ R2 : |x| < 1} ist u(x) = ln(|x|) aber als Funktion in L2 (Ω) erklärt. Dies wird klar
bei Betrachtung der approximierenden, stetigen Funktionen
ln(|x|) für k−1 < |x| < 1,
uk (x) :=
ln(k−1 ) für 0 ≤ |x| ≤ k−1 .
Man rechnet leicht nach, daß (uk )k∈N eine Cauchy-Folge bzgl. der L2 -Norm auf Ω ist und in
allen Punkten x ∈ Ω (bis auf x = 0 ) uk (x) → u(x) (k → ∞) gilt.
26
Wir betrachten nun die Funktion u(x) := |x|−1 , welche ebenfalls auf Ω0 stetig und unbeschränkt
ist. In diesem Fall bilden die approximierenden Funktionen
−1
|x|
für k−1 < |x| < 1,
uk (x) :=
k für 0 ≤ |x| ≤ k−1 ,
wegen
kuk k2Ω
= 2π
Z
k −1
2
k r dr + 2π
Z
1
r −1 dr = 2π
k −1
0
1
2
+ ln(k) → ∞
(k → ∞)
keine Cauchy-Folge bzgl. der L2 -Norm, d.h.: Dieses u ist zu singulär, um als L2 -Funktion auf Ω
erklärt zu sein. Bei der analogen Betrachtung auf der Einheitskugel im R3 ergibt sich dagegen,
daß u(x) = |x|−1 in diesem Fall sehr wohl in L2 (Ω) liegt. Die Zugehörigkeit von Funktionen mit
lokalen Singularitäten zum Lebesgue-Raum L2 (Ω) hängt also von der jeweiligen Raumdimension
ab. Wir werden denselben Effekt auch beim Sobolew-Raum H 1 (Ω) finden.
(ii) H 1 -Funktionen: Wir betrachten wieder die Funktion u(x) = ln(|x|) auf der punktierten
Kreisscheibe Ω0 ⊂ R2 . Ihr Gradient ∇u(x) = |x|−2 x verhält sich bei Annäherung an x = 0
wie |∇u(x)| ≈ |x|−1 . Im Hinblick auf das eben diskutierte Beispiel ist ∇u also nicht zu einer L2 Funktion auf die volle Kreisscheibe Ω fortsetzbar. Folglich ist u auch nicht in H 1 (Ω) . Wir sehen,
daß insbesondere die Greensche Funktion zum Laplace-Operator in zwei Raumdimensionen nicht
im Energie-Raum“ H 1 (Ω) liegt. Man beachte, daß v(x) = ln(x) in drei Raumdimensionen
”
aber sehr wohl in H 1 (Ω) liegt; der kritische Grenzfall ist hier die stärker singuläre Funktion
u(x) = |x|−1 .
Als zweites Beispiel zeigen wir, daß H 1 -Funktionen in mehr als einer Dimension nicht beschränkt sein müssen. Auf Ω0 sei die Funktion
u(x) = ln(ln(|x|−1 ) + 1)
betrachtet. Da | ln ln(r −1 )| für r → 0 langsamer wächst als | ln(r)| , ist u sicherlich zu einer
L2 -Funktion auf Ω fortsetzbar. Wir berechnen nun den Gradienten
∇u(x) = −
x
|x|2 (ln(|x|−1 )
+ 1)
.
Die zugehörigen abgeschnittenen“ Funktionen
”
ln(ln(|x|−1 ) + 1) für k−1 < |x| < 1,
uk (x) :=
ln(ln(k) + 1)
für 0 ≤ |x| ≤ k−1 ,
haben die stückweise“ definierten Gradienten
”
(
x
∇uk (x) :=
|x|2 (ln(|x|−1 )+1)
0
für k−1 < |x| < 1,
für 0 ≤ |x| ≤ k−1 ,
27
welche überall (bis auf x = 0 ) gegen ∇u konvergieren. Aus der Abschätzung
2
Z
1
Z
2
r dr = 2π
r
1
1
dr
2
−1
−1
r
(ln(r
)
+
1)
r(ln(r
) + 1)2
k −1
k −1
1
2π
2π
=
≤ 2π
−1 = 2π −
−1
ln(r ) + 1 k
ln(k) + 1
k∇uk k = 2π
(1.3.17)
(1.3.18)
ersehen wir ferner, daß (∇uk )k∈N bzgl. der L2 -Norm eine Cauchy-Folge ist. Folglich ist u zu
einer Funktion im Sobolew-Raum H 1 (Ω) fortsetzbar. Mit der eben verwendeten Abschneide”
technik“ erhalten wir approximierende Funktionen uk , welche i.a. nur stückweise stetig differenzierbar sind, d.h. nicht im strengen Sinne in C 1 (Ω) liegen und somit nicht direkt in das oben
formulierte Approximationskonzept für H 1 -Funktionen passen. Dieser Mangel kann behoben
werden, in dem man statt abzuschneiden regularisiert, z.B. gemäß
uk (x) = ln(ln((|x| + k)−1 ) + 1).
Diese uk ∈ C 1 (Ω) bilden dann ebenfalls eine approximierende Folge von u bzgl. der H 1 -Norm.
Eine ähnliche Modifikation (schon bei der Definition der Sobolew-Räume) muß auch vorgenommen werden, um spezielle Gebiete Ω mit schlitz-artigen“ Randeinsprüngen einbeziehen zu
”
können. Solche Schlitz-Gebiete“ spielen eine wichtige Rolle z.B. in der Baumechanik, wenn die
”
Ausbreitung von Rissen in Bauteilen beschrieben werden soll.
Analog zu dem Sobolew-Raum H 1 (Ω) erster Ordnung“ quadrat-integrabler Funktionen
”
kann man auch Sobolew-Räume H m,p (Ω) höherer Ordnung m ∈ N , bestehend aus p-integrablen
Funktionen (1 ≤ p < ∞) , definieren. Diese erhält man durch Vervollständigung des Raumes
C m (Ω) bzgl. der Norm
kvkH m,p (Ω) := kvkpLp (Ω) + ... + k∇m vkpLp (Ω)p
1/p
.
Der Fall p = ∞ bedarf wieder einer gesonderten Betrachtung. Die Räume H m,∞ (Ω) werden
über die Gleichsetzung H m,∞ (Ω) := W m,∞ (Ω) als Räume sog. verallgemeinert differenzier”
barer“ Funktionen mit distributionellen Ableitungen in L∞ (Ω) definiert. Wir wollen auf diese
Begiffsbildungen nicht weiter eingehen und verweisen statt dessen auf die einschlägige Literatur
über Sobolew-Räume (z.B.: Wloka (1982)).
1.3.2 Eigenschaften von Lebesgue- und Sobolew-Räumen
Wir wollen im folgenden einige wichtige Eigenschaften von Lebesgue- und Sobolew-Räumen
zusammenstellen, welche später bei der Analyse numerischer Verfahren benötigt werden.
Sei 1 < p < ∞ und q := p/(p − 1) . Dann gilt für Funktionen u ∈ Lp (Ω) und v ∈ Lq (Ω)
die allgemeine Höldersche Ungleichung“
”
Z
Z
1/p Z
1/q
p
|u(x)| dx
|v(x)|q dx
,
(1.3.19)
u(x)v(x) dx ≤
Ω
Ω
Ω
bzw. in Kurzform |(u, v)Ω | ≤ kukLp (Ω) kvkLq (Ω) . Für die Grenzfälle p = ∞ bzw. q = 1 gilt
|(u, v)Ω | ≤ kukL∞ (Ω) kvkL1 (Ω) .
(1.3.20)
28
Die variationelle Methode zum Nachweis von schwachen“ Lösungen der Poisson-Gleichung
”
basierte auf der Eigenschaft der bilinearen Form (∇u, ∇v)Ω , auf dem Teilraum H01 (Ω) ⊂ H 1 (Ω)
ein Skalarprodukt zu sein.
Hilfssatz 1.2 (Poincarésche Ungleichung): Für Funktionen v ∈ H01 (Ω) gilt die sog. Poin”
carésche Ungleichung“
kvkΩ ≤ dΩ k∇vkΩ ,
(1.3.21)
mit dem Durchmesser dΩ := diam(Ω) des Gebiets Ω .
Beweis: Wir geben den Beweis nur in zwei Raumdimensionen. In höheren Dimensionen verläuft
die Argumentation ganz analog. Sei Q eine Quadrat der Kantenlänge L = dΩ , in welchem das
Gebiet Ω enthalten ist. O.B.d.A. sei das Koordinatensystem so verschoben und gedreht, daß
Q = (0, L)×(0, L) . Für irgendein v ∈ H01 (Ω) sei (vk )k∈N ⊂ C0∞ (Ω) eine approximierende Folge.
Mit v̂k bezeichnen wir die trivialen Fortsetzungen der vk auf Q :
vk (x) für x ∈ Ω,
v̂k (x) :=
0
für x ∈ Q \ Ω.
Diese sind dann ebenfalls in C0∞ (Q) . Wir setzen nun w := v̂k . Zunächst gilt in Punkten
(x, y) ∈ Q :
Z x
∂ξ w(ξ, y) dξ,
w(x, y) = w(0, y) +
0
und folglich, bei Beachtung von w(0, y) = 0 ,
2
|w(x, y)| ≤ L
Z
L
0
|∂ξ w(ξ, y)|2 dξ
Integration zunächst über y ∈ (0, L) und danach über x ∈ (0, L) ergibt
Z
0
LZ L
0
2
|w(x, y)| dy dx ≤ L
2
Z
0
LZ L
0
|∂ξ w(ξ, y)|2 dξ dy.
Dies bedeutet
kwkQ ≤ Lk∇wkQ .
und wegen w = v̂k ≡ 0 auf Q \ Ω :
kvk kΩ ≤ Lk∇vk kΩ .
Für k → ∞ überträgt sich diese Beziehung durch Stetigkeit auf v ∈ H01 (Ω) .
Q.E.D.
Die variationelle Methode liefert auch die Existenz von Lösungen der 1. RWA des LaplaceOperators, wenn die Randwertvorgaben inhomogen sind. Im allgemeinen Fall findet man eine
schwache Lösung v ∈ H 1 (Ω) . Wir haben gesehen, daß H 1 -Funktionen Singularitäten haben
können. Es stellt sich also die Frage, in welchem Sinne die Randwerte von der schwachen“
”
Lösung überhaupt angenommen werden.
29
Hilfssatz 1.3 (Spur-Lemma): Für Funktionen v ∈ C 1 (Ω) gilt die sog. Spur-Abschätzung“
”
kvkL2 (∂Ω) ≤ c(Ω) kvkH 1 (Ω)
(1.3.22)
mit einer Ω-abhängigen Konstante c(Ω) .
Beweis: Zuerst betrachten wir den Spezialfall des Einheitsquadrats Ω = (0, 1) × (0, 1) . Sei
v ∈ C 1 (Ω) . Für Punkte (0, y) ∈ ∂Ω gilt
Z x
∂ξ v(ξ, y) dξ + v(x, y), x ∈ [0, 1].
v(0, y) = −
0
und folglich
2
|v(0, y)| ≤
Z
1
0
Z
2
|∂ξ v(ξ, y)| dξ + |v(x, y)| ≤ 2
1
0
|∂ξ v(ξ, y)|2 dξ + 2|v(x, y)|2 .
Integration zunächst über y ∈ (0, 1) und dann über x ∈ (0, 1) liefert
Z
0
1
2
|v(0, y)| dy ≤ 2
Z
0
1Z 1
0
2
|∂ξ v(ξ, y)| dξ dy + 2
Z
0
1Z 1
0
|v(x, y)|2 dy dx.
Dieselbe Argumentation kann auch für die drei anderen Randkomponenten von Ω angewendet
werden. Zusammenfassung der sich ergebenden Abschätzungen ergibt dann
kvk2L2 (∂Ω) ≤ 8kuk2H 1 (Ω) .
Die gezeigte Argumentation für das Einheitsquadrat läßt sich ohne Probleme für allgemeine
Polygongebiete modifizieren. Im allgemeineren Fall eines krumm berandeten Gebiets Ω erhält
man dasselbe Resultat mit Hilfe lokaler Transformationen, welche krumme Randstücke lokal
gerade transformieren, so daß wieder das obige Argument angewendet werden kann. Q.E.D.
Mit Hilfe des Spurlemmas können wir Funktionen v ∈ H 1 (Ω) eine Spur“ v|∂Ω ∈ L2 (∂Ω)
”
zuordnen, was die Frage nach der Annahme von Randwerten durch die schwache Lösung der 1.
RWA beantwortet. Sei v ∈ H 1 (Ω) und (vk )k∈N ⊂ C 1 (Ω) eine approximierende Folge. Aufgrund
der Spurabschätzung gilt dann
kvk − vl kL2 (∂Ω) ≤ c(Ω) kvk − vl kH 1 (Ω) ,
k, l ∈ N.
Da die Norm auf der rechten Seite für k, l → ∞ gegen Null konvergiert, folgt, daß die Spuren
vk|∂Ω (k ∈ N) auf ∂Ω eine Cauchy-Folge im Lebesgue-Raum L2 (∂Ω) bilden. Deren Limes
v|∂Ω ∈ L2 (∂Ω) wird dann als die Spur“ der Funktion v ∈ H 1 (Ω) bezeichnet. In diesem Sinne
”
nehmen schwache H 1 -Lösungen vorgegebene Randwerte an.
Das Variationsargument liefert zunächst nur die Existenz einer schwachen“ Lösung u ∈
”
der Poisson-Gleichung. Um zu sehen, daß diese im Fall glatter“ Daten auch klassische“
”
”
Lösung ist, zeigt man (mit einigem Aufwand) u ∈ H m (Ω) für sukzessive ansteigendes m ≥ 2 .
Hieraus kann dann geschlossen werden, daß u auch bis zur gewünschten Stufe klassisch differenzierbar ist. Dazu bedient man sich einer sog. Sobolewschen Ungleichung“. Zur Motivation
”
sei zunächst der eindimensionale Fall betrachtet.
H 1 (Ω)
Beispiel 1.2: Wir betrachten das Intervall Ω = (0, 1) ⊂ R1 . Für eine Funktion u ∈ C 1 (Ω)
30
impliziert der Fundamentalsatz der Differential- und Integralrechnung, daß
Z x
u′ (ξ) dξ, x, y ∈ Ω.
u(x) = u(y) +
y
Daraus folgt nach Integration über y ∈ [0, 1] :
sup |u(x)| ≤
x∈Ω
Z
0
1
′
|u | dξ +
Z
1
0
|u| dξ = kukH 1,1 (Ω) ,
mit der Norm des Sobolew-Raums H 1,1 (Ω) . Dies bedeutet, daß in einer Raumdimension eine
H 1,1 -Funktion beschränkt ist. Darüber hinaus ist sie sogar stetig (genauer im L2 -Sinne äquivalent zu einer stetigen Funktion), was man mit Hilfe des üblichen Approximationsarguments
erschließt. Hierfür reicht schon die L1 -Integrabilität der ersten Ableitung aus.
In höheren Dimensionen ist die Situation komplizierter. Wir haben schon am Beispiel der
Funktion v(x) = ln(ln(|x|−1 )+1) gesehen, daß Funktionen in H 1 (Ω) (im R2 ) i.a. unbeschränkt
sein können und man ihnen folglich auch nicht überall Punktwerte zuordnen kann. Dies ist aber
möglich für Funktionen in Sobolew-Räumen höherer Ordnung. Wir präsentieren hier als Beispiel
den folgenden Sobolewsche Einbettungssatz“.
”
Hilfssatz 1.4 (Sobolewsche Ungleichung): Für Funktionen v ∈ C 2 (Ω) gilt in zwei Raumdimensionen die Abschätzung
sup |v(x)| ≤ c(Ω) kvkH 2 (Ω)
(1.3.23)
x∈Ω
mit einer Ω-abhängigen Konstante c(Ω) .
Beweis: Für den nicht trivialen Beweis verweisen wir auf die einschlägige Literatur über SobolewRäume (z.B.: Wloka (1982)).
Q.E.D.
Analog wie schon vorher bei der Spurabschätzung dient die Sobolewsche Ungleichung (1.3.23)
zur Definition von Punktwerten von Funktionen in Sobolew-Räumen. Für ein v ∈ H 2 (Ω) sei wieder (vk )k∈N ⊂ C 2 (Ω) eine approximierende Folge. Mit der Sobolewschen Ungleichung (1.3.23)
erschließen wir, daß (vk )k∈N auch Cauchy-Folge bzgl. der Maximumnorm ist. Folglich können
für v ∈ H 2 (Ω) Punktwerte definiert werden durch
v(x) := lim vk (x),
k→∞
x ∈ Ω.
In diesem Sinne besteht also eine ( stetige“) Einbettung H 2 (Ω) ֒→ C(Ω) . Die Abschätzung
”
(1.3.23) läßt sich (im R2 ) übertragen auf die Normen der Sobolew-Räume H 2,1 (Ω) und H 1,p (Ω)
für p > 2 . Folglich bestehen die stetigen Einbettungen
H 2,1 (Ω) ∪ H 1,p (Ω) ֒→ C(Ω),
p > 2, im R2 .
Weitere Sobolewsche Ungleichungen führen auf die stetigen Einbettungen
H 1 (Ω) ֒→ Lp (Ω) (1 ≤ p < ∞) im R2 ,
H 1 (Ω) ֒→ L6 (Ω) im R3 .
(1.3.24)
31
Von fundamentaler Bedeutung ist der sog. Rellichsche Auswahlsatz“. Wir formulieren hier nur
”
eine einfache Variante, welche weiter unten benötigt wird.
Hilfssatz 1.5 (Rellichscher Auswahlsatz): Die natürliche Einbettung des Sobolew-Raumes
H 1 (Ω) in L2 (Ω) ist kompakt, d.h.: Aus jeder bzgl. der H 1 -Norm beschränkten Folge (vk )k∈N ⊂
H 1 (Ω) ⊂ L2 (Ω) läßt sich eine Teilfolge auswählen, welche in L2 (Ω) gegen einen Limes v
konvergiert. Dieser Limes ist dann auch wieder in H 1 (Ω) .
Beweis: Für den Beweis wird auf die Literatur verwiesen; z.B. Wloka (1982).
Q.E.D.
Der Rellichsche Auswahlsatz ist das Sobolew-Raum-Analogon des Auswahlsatzes von Arzelà-Ascoli für gleichgradig stetige“ Folgen stetiger Funktionen (siehe das Vorlesungsskriptum
”
Numerische Mathematik I).
1.3.3 Elemente der Spektraltheorie elliptischer Operatoren
Eine der wichtigsten Anwendungen des Rellichschen Auswahlsatzes findet sich in der Spektral”
Theorie“ elliptischer Differentialoperatoren, speziell des Laplace-Operators. Wir wollen deren
Elemente hier kurz entwickeln. Dabei haben wir vor allem deren Anwendung in der Lösungstheorie für parabolische ARWAn im Auge. Ferner werden wir später die numerische Lösung von
Eigenwertaufgaben des Laplace-Operators mit Hilfe von Finite-Elemente-Verfahren untersuchen,
wobei Resultate der Spektraltheorie benötigt werden.
Wir haben gesehen, daß für jede rechte Seite f ∈ L2 (Ω) eine eindeutige schwache“ Lösung
”
u ∈ H01 (Ω) der 1. RWA des Laplace-Operators existiert:
−∆u = f
in Ω,
u|∂Ω = 0.
(1.3.25)
Diese ist bestimmt durch die variationelle Beziehung
(∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.3.26)
Die Zuordnung f 7→ Sf := u definiert dann einen linearen Operator S : L2 (Ω) 7→ L2 (Ω) , der in
diesem Sinne als die L2 -Inverse“ des Laplace-Operators auf Ω unter Dirichlet-Randbedingungen
”
bezeichnet werden kann. Der Beziehung
k∇uk20 = (f, u) ≤ kf k0 kuk0 ≤ dΩ kf k0 k∇uk0
entnehmen wir, daß
kSf k0 ≤ dΩ k∇Sf k0 ≤ d2Ω kf k0 ,
d.h.: Der Lösungsoperator S : L2 (Ω) 7→ L2 (Ω) ist beschränkt und wegen der kompakten Einbettung H 1 (Ω) ֒→ L2 (Ω) sogar kompakt. Wir haben schon gesehen, daß der Laplace-Operator
als Operator im Hilbert-Raum L2 (Ω) symmetrisch und positiv-definit ist:
(−∆u, v) = (∇u, ∇v) = (u, −∆v),
2
(−∆u, u) = k∇uk20 ≥ d−2
Ω kuk0 .
Dies gilt für Funktionen u, v ∈ D(∆) im Definitionsbereich der L2 -Realisierung“ des Laplace”
Operators, welcher definiert ist durch
D(∆) := v ∈ H01 (Ω) : |(∇v, ∇ϕ)| ≤ c(v)kϕk0 , ϕ ∈ H01 (Ω) ⊂ L2 (Ω).
32
Für glatt berandete Gebiete oder konvexe Polygongebiete Ω kann man zeigen, daß D(∆) =
H01 (Ω) ∩ H 2 (Ω) . Im Fall einspringender Ecken ist dagegen D(∆) 6⊂ H 2 (Ω) .
Wir haben damit eine Realisierung des Laplace-Operator im Hilbert-Raum L2 (Ω) konstruiert, welche auf ihrem Definitionsbereich D(∆) symmetrisch ist, diesen ein-eindeutig auf ganz
L2 (Ω) abbildet, also bijektiv ist und deren Inverse S = (−∆)−1 kompakt ist. Damit ist der
Rahmen für die Anwendung abstrakter Resultate der Funktionalanalysis kompakter Operatoren
geschaffen. Für das Eigenwertproblem des Laplace-Operators
−∆w = λw
in Ω,
w|∂Ω = 0,
(1.3.27)
mit Eigenfunktion w ∈ H01 (Ω) und Eigenwert λ ∈ R gelten die folgenden Aussagen:
– Es existieren nur relle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... , welche sich im Endlichen nicht häufen können. Die zugehörigen Eigenräume E(λi ) sind endlich dimensional.
– Es existiert ein vollständiges Orthonormalsystem von Eigenfunktionen {wi )i∈N ⊂ L2 (Ω) ,
d.h.: Für jedes u ∈ L2 (Ω) gilt die L2 -konvergente Fourier13 -Entwicklung“
”
∞
X
(u, wi ) wi .
(1.3.28)
u=
i=1
– Mit Hilfe der Eigenwerte λi (ihrer Vielfachheiten entsprechend oft gezählt) und zugehörigen (orthonormierten) Eigenfunktionen wi lassen sich allgemeine Funktionen des LaplaceOperators definieren. Sei Φ(z) eine meromorphe Funktion, so daß die Eigenwerte λi keine
Pole sind. Dann wird durch
Φ(−∆)u :=
∞
X
Φ(λi )(u, wi ) wi
(1.3.29)
i=1
ein linearer Operator in L2 (Ω) erklärt. Wenn Φ(z) beschränkt ist, wird auch Φ(−∆)
beschränkt und ist auf ganz L2 (Ω) erklärt.
Diese Aussagen zeigen die starke Parallelität zwischen kompakten Operatoren bzw. von (dicht
definierten) Operatoren mit kompakter Inverser im Hilbert-Raum und durch (n × n)-Matrizen
dargestellte linearen Abbildungen des Rn .
13
Jean-Baptiste Baron de Fourier (1768-1830): französischer Mathematiker und Physiker; Mitglied der Pariser
Akademie lehrte an der École Polytechniqe; begleitete Napoleon auf seinem Feldzug nach Ägypten; zählt zu den
bedeutendsten Mathematikern des 19. Jahrhunderts; fand bei seinen Arbeiten zur Theorie der Wärmeleitung die
Darstellbarkeit periodischer Funktionen durch triginometrische Reihen.
1.4 Parabolische Probleme
33
Die sog. eindimensionale Wärmeleitungsgleichung“
”
∂t u = ∂x2 u,
(1.4.30)
oder allgemeiner in höheren Ortsdimensionen
∂t u − ∆u = f,
(1.4.31)
wird üblicherweise auf Zylindern QT := Ω × I des Orts/Zeit-Raumes betrachtet. Dabei sind
Ω ⊂ Rd ein Ortsgebiet und I := (0, T ] ein Zeitintervall. Im örtlich eindimensionalen Fall
(d = 1) ist die natürliche Anfangskurve Γ = {(x, t) ∈ R2 : t = 0} gerade Charakteristik, so
daß das zugehörige Cauchysche Anfangswertproblem i.a. nicht lösbar ist. Entlang Γ dürfen, wie
wir noch sehen werden, nur Anfangsbedingungen an u selbst gestellt werden: u|t=0 = u0 (x).
Entlang eines nicht-charakteristischen örtlichen“ Randes {(x, t) ∈ Rd+1 : x ∈ ∂Ω, t > 0} gilt
”
dagegen dasselbe wie im elliptischen Fall, d.h.: Die zugehörige Anfangswertaufgabe ist lösbar,
doch dürfen nur u oder ∂n u vorgeschrieben werden, wenn man stetige Abhängigkeit von den
Randdaten gewährleisten will.
Analog zum elliptischen Fall bieten sich drei verschiedene Typen von Randbedingungen
entlang des örtlichen Randes ∂Ω × I für die Anfangs-Randwert-Aufgabe (kurz ARWA“) der
”
Wärmeleitungsgleichung an. Zusätzlich zu der Anfangsbedingung
u|t=0 = u0
(1.4.32)
wird gefordert:
a) Dirichletsche Randbedingungen ( 1. ARWA“): u = g auf ∂Ω × I ;
”
b) Neumannsche Randbedingungen ( 2. ARWA“): ∂n u = g auf ∂Ω × I ;
”
c) Robinsche Randbedingungen ( 3. ARWA“): ∂n u + αu = g auf ∂Ω × I .
”
Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese ARWAn sind,
wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten ebenfalls wohl
gestellt. Unter einer klassischen Lösung“ verstehen wir eine Funktion u ∈ C(Q̄T ) ∩ C 2 (QT ) ,
”
welche der Differentialgleichung sowie den Anfangs- und Randbedingungen genügt. Ähnlich
wie bei elliptischen Problemen gibt es auch im parabolischen Fall den Begriff der schwachen
”
Lösung“, den wir hier aber wegen seiner Kompliziertheit nicht definieren wollen.
Zunächst diskutieren wir die Eindeutigkeitsfrage. Seien u(1) , u(2) wieder zwei klassische (analog zum elliptischen Fall definiert) Lösungen der 1. ARWA des Wärmeleitungsoperators, für die
k∇u(i) (t)kΩ existiert und beschränkt ist. Für die Differenz w := u(1) − u(2) gilt dann
∂t w − ∆w = 0 in Ω × I,
w|t=0 = 0, w|∂Ω = 0.
Multiplikation mit w , Integration über Ω und anschließende partielle Integration im Ort ergeben analog zum elliptischen Fall
0 = (∂t w, w) − (∆w, w) = 12 dt kwk2 + k∇wk2 .
Dies impliziert, daß kw(t)k ≤ kw(0)k = 0 für t ≥ 0, und somit die Eindeutigkeit der Lösung
34
und darüber hinaus deren stetige Abhängigkeit von den Anfangsdaten.
Die Existenzfrage läßt sich im Prinzip mit ähnlichen Methoden behandeln wie im elliptischen
Fall. Wir wollen das hier aus Zeitgründen nicht weiter verfolgen. Im örtlich eindimensionalen
Spezialfall Ω = (−∞, ∞) und f ≡ 0 läßt sich die Lösung der Anfangswertaufgabe explizit
angeben:
Z ∞
2
√ 1 e−(x−s) /4t u0 (s) ds.
(1.4.33)
u(x, t) =
4πt
−∞
Dies wird durch Nachrechnen verifiziert, wobei speziell auf die Existenz der auftretenden Integralterme zu achten ist. Man beachte, daß durch den Ansatz
s(x, t) =
2
√ 1 e−x /4t
4πt
eine spezielle Lösung der Wärmeleitungsgleichung gegeben ist.
Im Fall allgemeinerer, beschränkter Ortsgebiete Ω ⊂ Rd gewinnt man eine zu (1.4.33) korrespondierende Lösungsdarstellung mit Hilfe der Methode der Variablenseparation“. Einsetzen
”
des Lösungsansatzes u(x, t) = v(x)ψ(t) in die Wärmeleitungsgleichung ergibt
ψ ′ (t)v(x) = ψ(t)∆v(x)
∆v(x)
ψ ′ (t)
=
≡ konst. ,
ψ(t)
v(x)
⇒
für alle Argumente (x, t) ∈ QT . Die Separationsfaktoren v(·) ∈ C(Ω) ∩ C 2 (Ω) , v|∂Ω = 0 , und
ψ(·) ∈ C(I) sind also notwendig Lösungen der Eigenwertprobleme
−∆v(x) = λv(x) , x ∈ Ω ,
−ψ ′ (t) = λψ(t) , t ≥ 0 ,
unter den Nebenbedingungen v|∂Ω = 0 bzw. ψ(0) = 1 , mit Parametern λ ∈ R. Die Eigenwertaufgabe für v(x) besitzt, wie schon oben diskutiert, eine abzählbare Folge von Lösungen λj > 0
und vj :
−∆vj = λj vj (j = 1, 2, 3, ...)..
Die Eigenfunktionen (vj )j∈N bilden ein vollständiges Orthonormal-System im Raum L2 (Ω) der
auf Ω Lebesgue-meßbaren und quadratintegrablen Funktionen.
Die zugehörigen Lösungen für ψ(t) sind ψj (t) = e−λj t . Die Anfangsfunktion besitzt die
(verallgemeinerte) Fourier-Entwicklung:
0
u (x) =
∞
X
u0j vj (x) ,
u0j
=
j=0
Z
u0 (x)vj (x) dx .
I
Durch Superposition der Einzellösungen für j ∈ N ,
u(x, t) :=
∞
X
u0j vj (x)e−λj t ,
(1.4.34)
j=1
erhalten wir folglich eine Lösung der Wärmeleitungsgleichung, welche den Randbedingungen
und insbesondere den Anfangsbedingungen genügt. (Zum Nachweis überprüfe man die Konvergenz der Reihen der jeweils nach x sowie t abgeleiteten Einzellösungen.) Im eindimensionalen
35
Spezialfall Ω = (0, 1) ⊂ R1 ist gerade
vj (x) = αj sin(jπx) ,
λj = j 2 π 2 ,
Z
αj =
sin2 (jπx) dx
I
−1/2
(j ∈ N),
und die Lösungsdarstellung erhält die explizite Form
u(x, t) =
∞
X
u0j αj sin(jπx)e−aj
2 π2 t
(1.4.35)
j=1
Anhand dieser Lösungsdarstellungen lassen sich einige wichtige Eigenschaften der ARWA der
Wärmeitungsgleichung ablesen. Wie bei AWAn gewöhnlicher Differentialgleichungen entwickelt
sich die Lösung ausgehend vom Anfangswert in der Zeit. Der adäquate numerische Ansatz wird
also wieder ein Teilschrittverfahren in der Zeit sein. Im Ort pflanzen sich Störungen wie im
elliptischen Fall unendlich schnell“ fort. Irregularitäten in den Anfangs- oder Randdaten werden
”
sofort ausgeglättet, d.h.: im Innern des Zylindergebiets QT := Ω×(0, T ] ist die Lösung (im Falle
glatter rechter Seite f ) stets glatt.
Im folgenden wollen wir einige qualitative Eigenschaften von Lösungen der Wärmeleitungsgleichung diskutieren. Die Wärmeleitungsgleichung wird u.a. verwendet, um (ihrem Namen entsprechend) Wärmeausbreitungs- bzw. allgemein instationäre Diffusionsvorgänge zu beschreiben.
Es ist daher wichtig, garantieren zu können, daß ihre Lösungen bei kompatiblen Daten auch stets
positiv sind. Dies wird durch ein (dem elliptischen Fall ähnliches) Maximumprinzip geleistet.
t
T
Ω x (0, T]
Ω x (0, T]
x
Ω x {0}
Abbildung 1.4: Parabolisches Raum-Zeit-Gebiet
Satz 1.1 (Parabolisches Maximumprinzip): Für jede klassische Lösung der WärmeleitungsUngleichung
∂t u − ∆u ≤ 0
in Ω,
(1.4.36)
gilt das sog. Maximumprinzip“, d.h.: Sie nimmt im (halboffenen) Zylinder QT := Ω × (0, T ]
”
kein striktes Maximum an.
Beweis: Wir geben den Beweis nur für eine Raumdimension. Die Verallgemeinerung für höhere
Dimensionen ist dann evident. Für eine Lösung u der Wärmeleitungs-Ungleichung setzen wir
36
vε := u − εt, mit beliebigem ε > 0. Da vε stetig auf Q̄T ist, nimmt es in einem Punkt
(x0 , t0 ) ∈ Q̄T sein Maximum an. Angenommen, (x0 , t0 ) ∈ QT . Dann gilt ∂x2 vε (x0 , t0 ) ≤ 0 , und
folglich
∂t vε (x0 , t0 ) ≤ ∂t vε (x0 , t0 ) − ∂x2 vε (x0 , t0 ) = ∂t u(x0 , t0 ) − ε − ∂x2 u(x0 , t0 ) ≤ −ε.
Aus Stetigkeitsgründen ist dann auch ∂t vε (x0 , t) ≤ − 12 ε für t0 −h ≤ t ≤ t0 , mit einem geeigneten
h > 0. Hiermit folgern wir, daß
Z t0
∂t vε (x0 , t) dt ≤ − 12 εh < 0.
vε (x0 , t0 ) − vε (x0 , t0 − h) =
t0 −h
Dies führt auf den Widerspruch vε (x0 , t0 ) < vε (x0 , t0 − h). Also nimmt vε notwendig sein
Maximum für t = 0 an. Da ε > 0 beliebig klein gewählt werden darf, gilt diese Aussage auch
für den (stetigen) Grenzfall ε = 0 , d.h. für die Lösung u .
Q.E.D.
Als Konsequenz des parabolischen“ Maximumprinzips sehen wir insbesondere, daß eine Lösung
”
der (homogenen) Wärmeleitungsgleichung
∂t u − ∆u = 0 in Ω,
u = 0 auf ∂Ω,
(1.4.37)
zu nicht-negativen Anfangsdaten u0 ≥ 0 (u|∂Ω = 0) nicht-negativ bleibt für alle t ≥ 0 :
u0 ≥ 0
⇒
0 ≤ u(x, t) ≤ maxΩ u0 ,
(x, t) ∈ QT .
(1.4.38)
Ferner sind wieder klassische“ Lösungen u ∈ C(Q̄T ) ∩ C 2 (QT ) eindeutig bestimmt.
”
Satz 1.2 (Globale Beschränktheit): Für jede Lösung der inhomogenen Wärmeleitungsgleichung (1.4.31) gilt die a priori Abschätzung
ku(t)k ≤ e−λt ku0 k + λ−1 sup kf k,
(1.4.39)
[0,t]
mit dem kleinsten Eigenwert λ > 0 des elliptischen Operators −∆ auf Ω zu homogenen
Dirichlet-Randbedingungen.
Beweis: Wir betrachten die beiden Hilfsprobleme
∂t v − ∆v = 0 in QT ,
∂t w − ∆w = f in QT ,
v|∂Ω = 0, v|t=0 = u0 ,
w|∂Ω = 0, w|t=0 = 0.
(1.4.40)
(1.4.41)
Offenbar ist dann u = v + w wegen der Linearität des Wärmeleitungsoperators (Superpositionsprinzip). Wir schätzen nun die beiden Lösungsanteile v und w separat ab.
(i) Multiplikation von (1.4.40) mit v und Integration im Ort ergibt
2
1
2 dt kvk
+ k∇vk2 = 0.
Wir multiplizieren dies mit e2λt und finden
2λt
1
kvk2 + e2λt k∇vk2 − λe2λt kvk2 = 0.
2 dt e
37
Wegen λkvk2 ≤ k∇vk2 impliziert dies dt e2λt kvk2 ≤ 0 , und Integration bzgl. t ergibt
e2λt kv(t)k2 ≤ ku0 k2
bzw. wieder
kv(t)k ≤ e−λt ku0 k.
(ii) Multiplikation von (1.4.41) mit w und Integration im Ort ergibt
2
1
2 dt kwk
+ k∇wk2 = (f, w) ≤ 12 λkwk2 + 21 λ−1 kf k2 .
Mit Hilfe von λkwk2 ≤ k∇wk2 folgern wir
dt kwk2 + k∇wk2 ≤ λ−1 kf k2 .
Wir multiplizieren diese Ungleichung nun mit eλt und finden
dt eλt kwk2 + eλt k∇wk2 − λeλt kwk2 ≤ λ−1 eλt kf k2 ,
bzw.
dt eλt kwk2 ≤ λ−1 eλt kf k2 .
Integration bzgl. t ergibt
λt
2
−1
Z
t
eλs kf k2 ds,
Z t
kw(t)k2 ≤ λ−1 e−λt
eλs kf k2 ds.
e kw(t)k ≤ λ
0
0
Die Abschätzung
−λt
e
Z
t
0
impliziert dann kw(t)k ≤
behauptete Abschätzung.
λ−1 max
[0,t] kf k .
eλs ds ≤ λ−1 .
Kombination der Resultate für v und w liefert die
Q.E.D.
Als Folgerung aus diesem Satz ersehen wir insbesondere, daß bei einem parabolischen Problem der Einfluß der Anfangsdaten exponentiell mit der Zeit abklingt. Weiter interessiert das
Lösungsverhalten für Anfangsdaten u0 mit minimaler Regularität.
Satz 1.3 (Glättungseigenschaft): Für jede Lösung der homogenen Wärmeleitungsgleichung
(1.4.31) mit f ≡ 0 gelten die a priori Abschätzungen
k∂t u(t)k + k∆u(t)k ≤ k∆u0 k,
k∂t u(t)k + k∆u(t)k ≤ t
−1
0
ku k,
t ≥ 0,
t > 0,
(1.4.42)
(1.4.43)
vorausgesetzt, der Anfangswert u0 besitzt die erforderliche Regularität.
Beweis: Wir bedienen uns zum Beweis der sog. Spektral-Methode“, welche aber auf symmetri”
sche und autonome (d.h. nicht explizit von der Zeit abhängige) Operatoren beschränkt ist. Alternative Zugänge sind die Halbgruppen-Methode“, welche nicht die Symmetrie des Operators
”
38
erfordert, sowie die Energie-Methode“, welche im allgemeinen Fall und sogar für nichtlineare
”
Probleme anwendbar ist. Aus der Lösungsdarstellung (1.4.34) mit dem Orthonormalsystem von
Eigenfunktionen {vj }j∈N des Laplace-Operators,
u(x, t) :=
∞
X
u0j vj (x)e−λj t ,
j=1
folgern wir
∂t u(x, t) = ∆u(x, t) := −
∞
X
u0j λj vj (x)e−λj t .
j=1
Aufgrund der (verallgemeinerten) Parsevalschen14 Identität gilt demnach
k∂t uk2 = k∆uk2 =
∞
X
(u0j )2 λ2j e−2λj t .
j=1
Als erstes Resultat entnehmen wir dieser Beziehung, daß
k∂t uk2 = k∆uk2 ≤
∞
X
j=1
(u0j )2 λ2j = k∆u0 k2 .
Hieraus folgt wegen xe−x ≤ 1, x ≥ 0, :
k∂t uk2 = k∆uk2 = t−2
∞
∞
X
X
(u0j )2 = t−2 ku0 k2 ,
(u0j )2 (λj t)2 e−2λj t ≤ t−2
j=1
j=1
was den Beweis vervollständigt.
Q.E.D.
Als Folgerung aus diesem Satz finden wir nochmal bestätigt, daß die Wärmeleitungsgleichung
die Glättungseigenschaft“ besitzt, d.h.: Irregularitäten in den Anfangsdaten werden für t > 0
”
ausgeglättet. Durch Weiterführung der Argumentation im Beweis von Satz 1.3 lassen sich analog
beliebig hohe Ableitungen der Lösung abschätzen:
k∂tp u(t)k + k∇2p u(t)k ≤ c(p) k∆p u0 k,
t ≥ 0,
(1.4.44)
t > 0, p ∈ N.
(1.4.45)
sowie
k∂tp u(t)k + k∇2p u(t)k ≤ c(p) t−p ku0 k,
14
Mare-Antoine Parseval des Chênes (1755-1836): französischer Mathematiker; Privatgelehrter; Beiträge zu
Reihen, insbesondere Fourier-Reihen.
1.5 Hyperbolische Probleme
39
1.5 Hyperbolische Probleme
Die Wellengleichung
∂t2 u − ∆u = 0
(1.5.46)
wird in der Regel wieder auf einem Zylindergebiet QT := Ω × I mit einem (meist beschränkten)
Gebiet Ω ⊂ Rd und einem Intervall I = (0, T ] betrachtet. Die Frage nach der Wohlgestelltheit
zugehöriger Anfangs-Randwertaufgaben wollen wir nur für den örtlich eindimensionalen Fall
diskutieren. Die charakteristischen Steigungen der (örtlich) eindimensionalen Wellengleichung
∂t2 u = ∂x2 u
(1.5.47)
sind gerade gegeben durch dt/dx = ±1, d.h.: die Charakteristiken sind alle Geraden in der (x, t)Ebene mit der Steigung ±1. Die natürliche Anfangskurve Γ := {(x, t) : x ∈ Ω, t = 0} ist also
keine Charakteristik, so daß gemäß der Theorie die zugehörige Cauchysche Anfangswertaufgabe
bei Vorgabe von Werten u(x, 0) = u0 (x) und ∂t u(x, 0) = u1 (x) lösbar ist. Diese Lösung läßt
sich im Fall einer Raumdimension leicht angeben. Wir betrachten den Sonderfall Ω = R1 .
t
t0
(x0, t0)
B(x0, t0)
A(x0, t0)
x
x0
Abbildung 1.5: Hyperbolisches Raum-Zeit-Gebiet
Die Koordinatentransformation ξ = x + t, η = x − t überführt die Wellengleichung in die
Form
∂ξ ∂η u = 0.
Diese hat die Lösungen der Form
u(ξ, η) = F (ξ) + G(η)
mit beliebigen, hinreichend glatten Funktionen F (·) und G(·). Die allgemeine Lösung der Wellengleichung lautet demnach
u(x, t) = F (x + t) + G(x − t).
Zur Erfüllung der Anfangsvorgaben auf Γ muß nun gelten:
F (x) + G(x) = u0 (x),
F ′ (x) − G′ (x) = u1 (x).
40
Hieraus entnehmen wir, daß
F (x + t) + G(x + t) + F (x − t) + G(x − t) = u0 (x + t) + u0 (x − t),
Z x+t
F (x + t) − G(x + t) − F (x − t) + G(x − t) =
u1 (s) ds,
(1.5.48)
(1.5.49)
x−t
und folglich,
u(x, t) =
1
2
n
0
0
u (x + t) + u (x − t) +
Z
x+t
x−t
o
u1 (s) ds .
Dies ist die (eindeutige) klassische Lösung der Wellengleichung zu den vorgegebenen Anfangsdaten u0 (x), u1 (x) . Eine analoge Konstruktion ist auch in höheren Raumdimensionen möglich.
Die Form der Lösung u(x, t) zeigt, daß bei einem hyperbolischen Problem die Ausbreitungsgeschwindigkeit von Information endlich ist. Lokale Störungen pflanzen sich entlang der Charakteristiken (Geraden mit Steigung ±1 ) fort. Insbesondere erzeugen unstetige Anfangsdaten
notwendig auch unstetige Lösungen. Dies erfordert im Falle irregulärer Anfangs- oder Randdaten
einen neuartigen Lösungsbegriff, der auch Unstetigkeiten zuläßt. Für jeden Punkt (x0 , t0 ) ∈ QT
gibt es demnach einen Abhängigkeitsbereich“ A(x0 , t0 ) sowie einen Bestimmtheitsbereich“
”
”
B(x0 , t0 ) , innerhalb deren sich das Anfangswertproblem unabhängig vom restlichen Bereich
lösen läßt:
A(x0 , t0 ) := {x ∈ R : |x − x0 | ≤ t0 },
B(x0 , t0 ) := {(x, t) ∈ R × R+ : |x − x0 | ≤ t}.
Die Eindeutigkeit von Lösungen der Wellengleichung erschließt man wieder am leichtesten
mit Hilbertraum-Argumenten“. Sei u(x, t) eine klassische Lösung der ARWA
”
∂t2 u = ∆u in Ω,
u|t=0 = u0 , ∂t u|t=0 = u1 , u|∂Ω = 0,
(1.5.50)
mit endlicher Energie“ (kinetische + potentielle Energie)
”
E(t) := k∂t u(t)k2Ω + k∇u(t)k2Ω < ∞.
Multiplikation der Differentialgleichung mit ∂t u , Integration über Ω und anschließende partielle
Integartion ergibt
0 = (∂t2 u − ∆u, ∂t u) = 12 dt k∂t uk2 + k∇uk2 .
Dies impliziert, daß
k∂t u(t)k2 + k∇u(t)k2 = ku1 k2 + k∇u0 k2 ,
(1.5.51)
d.h. die Lösung ist eindeutig und hängt bzgl. der natürlichen Energie-Norm stetig von den
Anfangsdaten ab. Ferner bleibt die Gesamtenergie E(t) im System in der Zeit erhalten. Dies
entspricht der Vorstellung, daß bei einem Schwingungsprozeß, etwa der Schwingung eines elastischen Körpers oder einer Schallwelle, bei Vernachlässigung von Dämpfung im Verlaufe der Zeit
keine Energie verloren geht. Ein gutes“ Diskretisierungsverfahren für die Wellengleichung sollte
”
diese kritische Eigenschaft möglichst gut wiedergeben.
1.6 Übungen
41
1.6 Übungen
Übung 1.1: Gegeben sei die Anfangswertaufgabe (AWA) einer skalaren gew. Differentialgleichung
u′ (t) = f (t, u(t)), t ≥ t0 , u(t0 ) = u0 ,
mit einer analytischen Funktion f (t, x) mit gleichmäßig beschränkten Ableitungen
sup k∂tj ∂xk f (t, ·)k∞ ≤ K < ∞,
j,k≥0
t ≥ t0 ,
(z.B. die Funktion f (t, x) := sin(x) ). Man zeige, daß man durch den Taylor-Ansatz
u(t) = u0 +
∞
X
f (k−1) (t0 , u0 )
k=1
k!
(t − t0 )k
mit f (r) (t0 , u0 ) := (d/dt)r f (t, u(t))|t=t0 eine globale (d.h. für alle t ≥ t0 existierende) Lösung
der AWA erhält.
Übung 1.2: In der Vorlesung wurde die Typeneinteilung von linearen Differentialoperatoren 2.
Ordnung mit der Aufgabe motiviert, aus gegebenen Werten u(x0 , y0 ) und ∂n u(x0 , y0 ) entlang
einer Kurve Γ die Lösung u(x, y) über einen Taylor-Reihenansatz zu bestimmen. Diese Konstruktion wurde allerdings nur bis zu den drei zweiten Ableitungen ∂x2 u(x0 , y0 ) , ∂x ∂y u(x0 , y0 )
und ∂y2 u(x0 , y0 ) durchgeführt und hing von der Regularität einer gewissen Matrix A ab. Man
zeige, daß nach Bestimmung der zweiten Ableitungen die Konstruktion der vier dritten Ableitungen ∂x3 u(x0 , y0 ) , ∂x2 ∂y u(x0 .y0 ) , ∂x ∂y2 u(x0 , y0 ) und ∂y3 u(x0 , y0 ) auf dieselbe Matrix A führt.
Diese Aussage gilt auch für die weiteren, höheren Ableitungen. Die Vorgenommene Klassifizierung des Differentialoperators als elliptisch, parabolisch oder hyperbolisch basierend auf der
Konstruierbarkeit der Lösung aus den Randdaten ist also sinnvoll.
Übung 1.3: Man bestimme den Typ der Differentialgleichungen
a)
∂x ∂y u − ∂x u = 0,
b)
∂x2 u + ∂x ∂y u + y∂y2 u + 4u = 0,
c)
2(∂x + ∂y )2 u + ∂y u = 0.
(Hinweis: Das in der Vorlesung angegebene Kriterium für den Typ einer Gleichung kann auch
bei variablen Koeffizienten separat in jedem einzelnen Ortspunkt verwendet werden.)
Übung 1.4: Eine (skalare) lineare partielle Differentialgleichung (PDE) 2. Ordnung der Form
a11 ∂12 u + a12 ∂1 ∂2 u + a21 ∂2 ∂1 u + a22 ∂22 u = f
läßt sich durch Setzung u1 := ∂1 u, u2 := ∂2 u in ein System von PDE 1. Ordung umformen:
∂2 u1 − ∂1 u2 = 0,
a11 ∂1 u1 + a12 ∂1 u2 + a21 ∂2 u1 + a22 ∂2 u2 = f.
42
Man zeige, daß sich die in der Vorlesung für (skalare) lineare PDE 2. Ordnung durchgeführte
Typeneinteilung analog auch für Systeme 1. Ordnung der allgemeinen Form
b111 ∂1 u1 + b112 ∂1 u2 + b121 ∂2 u1 + b122 ∂2 u2 = f1 ,
b211 ∂1 u1 + b212 ∂1 u2 + b221 ∂2 u1 + b222 ∂2 u2 = f2 ,
vornehmen läßt (mit analogen Resultaten). Ziel ist dabei die Bestimmung von Kurven Γ ⊂ R2 ,
bei denen die Vorgabe von Anfangswerten für u1 und u2 entlang Γ die Konstruktion aller
Ableitungen von u1 und u2 , beginnend mit den zweiten Ableitungen ∂12 u1 , ∂1 ∂2 u1 , ∂22 u1 ,
∂12 u2 , ∂1 ∂2 u2 , ∂22 u2 und damit einen Taylor-Reihenansatz für die Lösung erlaubt. (Bem.: Wenn
die Konstruktion von u1 und u2 auf diesem Wege möglich ist, erhält man für die gegebene PDE
2. Ordnung dann durch weitere Vorgabe von u entlang Γ aus der Kenntnis von ∂1 u = u1 und
∂2 u = u2 im ganzen Lösungsgebiet dort auch eine Lösung u durch einfaches Aufintegrieren.)
Übung 1.5: In der Vorlesung wurde die Poincarésche Ungleichung
Z
Z
2
2
k∇u(x)k2 dx, dG := diam(G),
|u(x)| dx ≤ dG
G
G
nur für Funktionen u ∈ V0 (G) formuliert, d.h. welche auf dem ganzen Rand ∂G null sind. Der
Beweis funktioniert aber auch für Funktionen, die nur entlang eines Teils Γ ⊂ ∂G des Randes
mit Länge |Γ| =
6 0 null sind, d.h. auf dem Raum
V0 (Γ; G) := {v ∈ C 1 (G) ∩ C(G) : ∇v ∈ L2 (G)n , v|Γ = 0}.
(i) Man führe den Beweis dieser Verallgemeinerung der Poicaréschen Ungleichung für das Einheitsquadrat Q = (0, 1)2 ⊂ R2 und den Randteil Γ := {x = (x1 , 0) : 0 ≤ x1 ≤ 1} .
(ii) Kann die Poincareśche Ungleichung gültig bleiben, wenn der Randteil Γ ⊂ ∂G trivial ist,
etwa nur aus einem Punkt besteht? Man untersuche diese Frage anhand der in (i) gegebenen
Situation mit Γ := {(0, 0)} . Welche Konsequenzen hat die Antwort auf diese Frage für die
1. RWA des Laplace-Operators? (Hinweis: Man betrachte die Folge der Funktionen uk (r, θ) =
r 1/k .)
Übung 1.6: Auf einem beschränkten Gebiet Ω ⊂ Rn mit glattem Rand ∂Ω werden die folgende (a) zweite und (b) dritte Randwertaufgabe betrachtet:
(a)
(b)
− ∆u + au = f in Ω,
− ∆u + au = f in Ω,
∂n u = g auf ∂Ω,
∂n u + αu = g auf ∂Ω,
mit Konstanten a > 0 und α ≥ 0 . Man zeige, daß diese RWAn jeweils höchstens eine “klassische” Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω) haben können. Welches Problem ergibt sich im Fall a = 0 ,
d.h. für den reinen Laplace-Operator?
Übung 1.7: Für die klassische Lösung der Randwertaufgabe
−∆u = 1 in Ω,
u = 0 auf ∂Ω,
auf einem glatt berandetem Gebiet Ω ⊂ Q1 := {(x, y) ∈ R2 | 0 < x, y < 1} zeige man mit Hilfe
des Maximumprinzips die Einschließung 0 ≤ u(x) ≤ 18 . (Hinweis: Man vergleiche u mit der
1.6 Übungen
43
quadratischen Funktion v = 41 x(1 − x) + 14 y(1 − y) .)
Übung 1.8: Der Laplace-Operator ∆ = div grad hat für Funktionen u = u(r, θ) in Polarkoordinaten (r, θ) ∈ [0, ∞) × [0, 2π] die folgende Form:
∆u = (∂r2 + r −1 ∂r + r −2 ∂θ2 )u.
(i) Für ein ω ∈ (0, 2π] sei Sω := {(r, θ) : r > 0, θ ∈ (0, ω)} der zugehörige Sektor der (x, y)Ebene. Man zeige, daß die auf dem Gebiet G := Sω ∩ K1 (0) definierte Funktion
sω (r, θ) := r π/ω sin(θπ/ω)
harmonisch ist, d.h. ∆sω ≡ 0 , und den Randbedingungen sω (r, 0) = sω (r, ω) = 0 sowie
sω (1, θ) = sin(θπ/ω) genügt.
(ii) Man zeige, daß im Fall π < ω ≤ 2π , d.h. im Fall eines stumpfen Innenwinkels, die ersten
Ableitungen dieser Funktion zwar unbeschränkt aber noch (uneigentlich) quadrat-integrabel
sind, daß ihre zweiten Ableitungen aber nicht mehr quadrat-integrabel sind. Wie sieht das bei
spitzen Innenwinkeln, d.h. 0 < ω < π , aus?
Dieses Beispiel zeigt, daß klassische Lösungen von elliptischen RWAn auch zu glatten Daten am
Gebietsrand nicht regulär zu sein brauchen.
Übung 1.9: Man untersuche, ob die folgenden Funktionen auf dem Einheitsquadrat Ω =
{(x, y) ∈ R2 | 0 < x, y < 1} im Sobolew-Raum H 1 (Ω) liegen:
a) u(x, y) = |x − y|1/2 ,
1/2
b) u(x, y) = sin ln(1/r) , r = x2 + y 2
.
(Hinweis: Man untersuche die “uneigentliche” Riemann-Integrabilität der Ableitungen.)
Übung 1.10: Man zeige, daß für Funktionen u ∈ H 1 (Ω) unter der Mittelwertbedingung
Z
u(x) dx = 0
Ω
ebenfalls die Poincarésche Ungleichung gilt (mit einer Konstante cΩ ):
kukΩ ≤ cΩ k∇ukΩ .
(Hinweis: Zum Beweis gibt es zwei alternative Wege: Modifikation des direkten Beweises aus der
Vorlesung unter Verwendung von “Randwerten” u|Γ = 0 , oder Widerspruchsargument unter
Verwendung des Rellichschen Auswahlsatzes.)
Übung 1.11: Auf welchem der folgenden Gebiete ist die RWA
−∆u = 0 in Ω,
u|∂Ω = 0,
wohl gestellt, d.h. besitzt eine eindeutige schwache Lösung u ∈ H01 (Ω) (mit Begründung)?
44
a) gepunktete Kreisscheibe
Ω = {x ∈ R2 | 0 < |x| < 1} ⊂ R2 ;
b) geschlitzte Kreisscheibe
Ω = {x ∈ R2 | |x| < 1} \ Γ,
Γ := {x ∈ R2 | −
1
2
≤ x1 ≤ 21 , x2 = 0 } ⊂ R2 .
Übung 1.12: Man gebe eine variationelle Formulierung der folgenden Randwertaufgabe an:
−∆u + u = f in Ω,
∂n u + u|∂Ω = g,
und begründe, daß deren Lösung im Falle ausreichender Glattheit die RWA löst.
Übung 1.13: Welche von den folgenden Sobolewschen Ungleichungen sind richtig?
a)
b)
c)
d)
kukL∞ (Ω) ≤ c kukH 2 (Ω) ,
u ∈ H 2 (Ω), Ω ⊂ R3 ;
kukL∞ (Ω) ≤ c kukH 1 (Ω) ,
u ∈ H 1 (Ω), Ω ⊂ R2 ;
kukL∞ (Ω) ≤ c kukH 1,1 (Ω) ,
kukL1 (∂Ω) ≤ c kukH 1,1 (Ω) ,
u ∈ H 1,1 (Ω), Ω ⊂ R1 ;
u ∈ H 1,1 (Ω), Ω ⊂ R2 .
Man erkläre die Bedeutung der verwendeten Funktionenräume und Normen.
2 Differenzen-Verfahren für elliptische Probleme
In diesem Kapitel werden wir zunächst die klassischen Differenzenapproximationen zur Lösung
elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber beschränken wir uns dabei auf das Modellproblem der Poisson-Gleichung in zwei Raumdimensionen mit Dirichletschen
Randbedingungen, d.h. auf die 1. RWA:
Lu := −∆u = f
in Ω,
u = g auf ∂Ω.
(2.0.1)
Das Definitionsgebiet Ω ⊂ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen
Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen
Koeffizienten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen berücksichtigt.
2.1 Allgemeine Differenzenapproximationen
Zur Definition einer sog. Differenzenapproximation“ der RWA wird das Lösungsgebiet Ω durch
”
ein endliches (nicht notwendig äquidistantes oder kartesisches) Punktgitter überdeckt. Wir definieren disjunkte Punktmengen
Ωh := { innere” Gitterpunkte in Ω},
”
∂Ωh := { Rand-Gitterpunkte” nahe bei ∂Ω},
”
und setzen Ωh := Ωh ∪ ∂Ωh . Welche Punkte zu ∂Ωh gehören, hängt von der Eigenart der
gewählten Differenzenapproximation ab; im folgenden werden verschiedene Beispiele betrachtet.
Der Parameter h > 0 beschreibt wie üblich die Feinheit” des Gitters Ωh , d.h. so etwas wie den
”
mittleren Abstand benachbarter Gitterpunkte. Die Gitterpunkte in ∂Ωh seien ähnlich dicht verteilt wie die in Ωh . Die Differentialgleichung wird nun in den Punkten in Ωh betrachtet und jede
Ableitung durch einen Differenzenquotient ersetzt. Diese Differenzenappoximation greift dabei
auch auf Randpunkte in ∂Ωh zurück. So ergibt sich ein Differenzenschema zur Bestimmung
einer diskreten Lösung uh : Ωh → R der allgemeinen Gestalt
Lh uh (P ) = fh (P ) für P ∈ Ωh ,
uh (P ) = gh (P ) für P ∈ ∂Ωh ,
(2.1.2)
wobei fh und gh geeignete Approximationen der rechten Seite f bzw. der Randwerte g sind
(im einfachsten Fall etwa gh (P ) = g(P ) ). Auf natürliche Weise verstehen wir die Anwendung
des Operators Lh auch auf die kontinuierliche Lösung u ∈ C(Ω) . Zur Konstruktion konkreter Differenzenoperatoren definieren wir zu jedem Punkt eine Umgebung von (verschiedenen)
Punkten
N (P ) := {Qi , i = 0, ..., rP } (Konvention: Q0 := P ),
auf denen eine Differenzenapproximation des Laplace-Operators definiert ist. Der Differenzenoperator hat dann die Form
X
Lh uh (P ) =
σ(P, Q)uh (Q),
(2.1.3)
Q∈N (P )
mit gewissen Koeffizienten σ(P, Q). Diese sind so zu bestimmen, daß die folgenden Forderungen
erfüllt sind:
45
46
Differenzen-Verfahren für elliptische Probleme
i) Konsistenz: Das Schema ist konsistent”, d.h.: Für den Abschneidefehler”
”
”
τh (P ) := Lh u(P ) − fh (P ),
P ∈ Ωh ,
gilt
max |τh (P )| → 0 (h → 0).
(2.1.4)
P ∈Ωh
Wünschenswert wäre eine möglichst hohe Konsistenzordnung“ m ≥ 1 , d.h.:
”
max |τh (P )| = O(hm ).
(2.1.5)
P ∈Ωh
Wir werden uns im folgenden üblicherweise meist mit m = 2 begnügen. Aus Ökonomiegründen
wird man rP von moderater Größe wählen ( rP ≈ 4 − 24 in zwei Raumdimensionen).
ii) Stabilität: Das Differenzenschema ist wohl-gestellt, d.h.: Es bestimmt eindeutige diskrete Lösungen (uh (P ))P ∈Ωh , welche gleichmäßig bzgl. h stetig von den Daten des Problems
abhängen. Dazu wäre z.B. eine Stabilitätsabschätzung des folgenden Typs zu beweisen:
(2.1.6)
max |uh (P )| ≤ cstab max |Lh uh (P )| + max |uh (P )| ,
P ∈Ωh
P ∈Ωh
P ∈∂Ωh
mit einer von h unabhängigen Konstante cstab > 0 .
iii) Verträglichkeit: Der Differenzenoperator Lh soll analoge charakteristische Eigenschaften
wie der kontinuierliche L besitzen; z.B.: Symmetrie, Definitheit, Maximumprinzip, u.s.w.
Das Hauptziel der Konvergenzanalyse von Differenzenschemata ist der Nachweis, daß eine
Konsistenzordnung m auch eine Konvergenzordnung m des Fehlers eh := u − uh impliziert:
max |eh (P )| = O(hm ),
(2.1.7)
P ∈Ωh
vorausgesetzt, die Lösung u ist ausreichend regulär.
2.1.1 Konsistenz
Für den Fall fh (P ) = f (P ) betrachten wir o.B.d.A. den Punkt P = Q0 = 0 und die Punktumgebung N (P ) = {Qi = (xi , yi ), i = 0, ..., rP } . Taylorentwicklung ergibt:
u(Qi ) = u(P ) + xi ∂x u(P ) + yi ∂y u(P ) + 21 x2i ∂x2 u(P ) + xi yi ∂x ∂y u(P ) + 12 yi2 ∂y2 u(P ) + · · · .
Wir wollen aus diesem Ansatz die Koeffizienten σi := σ(P, Qi ) im Differenzenoperator so bestimmen, daß eine vorgegebene Konsistenzordnung garantiert ist. Mit dem Ansatz τh (P ) = O(hm )
erhält man durch Koeffizientenvergleich als notwendige und hineichende Bedingung für Konsistenz:
(B0) Konsistenz: Für die Koeffizienten des Differenzenschemas gilt:
rP
X
i=0
σi =
rP
X
i=0
xi σi =
rP
X
i=0
y i σi =
rP
X
i=0
xi yi σi = 0,
1
2
rP
X
i=0
x2i σi =
1
2
rP
X
i=0
yi2 σi = 1.
(2.1.8)
47
Aus diesen Beziehungen sind die Koeffizienten σi , i = 0, ..., rP , im Differenzenoperator Lh zu
bestimmen. Für Konsistenz sind also im allgemeinen Fall eines völlig unstrukturierten Gitters
mindestens 6 Punkte in N (P ) erforderlich. Die Konsistenz des Differenzenschemas ist offenbar
äquivalent dazu, daß der Differenzenoperator exakt” ist für quadratische Polynome:
”
u ∈ P2 :
Lh u(P ) = Lu(P ),
P ∈ Ωh .
(2.1.9)
Da man in der Regel Diskretisierungen auf Folgen von Gittern mit Gitterweiten h → 0 betrachtet, führt man skalierte Parameter ξi = h−1 xi , ηi = h−1 yi ein, um sich von der h-Abhängigkeit
in den Koeffizienten zu befreien. Wegen
1 2
2h
rP
X
ξi2 σi = 12 h2
i=0
rP
X
ηi2 σi = 1,
i=0
ist σi = 0 oder σi ∼ h−2 . Wenn also eine Lösung für (σ0 , . . . , σrP ) existiert, dann ergibt sich für
den Konsistenzfehler
τh (P ) = (Lh u − Lu)(P ) = O(h3 ξi3 σi + . . .) = O(h).
(2.1.10)
Auch bei ganz irregulärer Gitterpunktsanordnung erhält man somit schon mindestens eine Konsistenzordnung m = 1 . Es gibt mehrere Möglichkeiten, die Ordnung zu erhöhen:
– Man nimmt mehr Gitterpunkte in die Menge N (P ) auf.
– Man ordnet das Gitter regulär an, um in der Taylor-Entwicklung des Abschneidefehlers
Weghebeffekte zu erzielen.
Wir werden uns nun im folgenden mit regulären, speziell äquidistanten, kartesischen Gittern
beschäftigen. Der Einfachheit halber sollen die Gitterpunkte äquidistant entlang von Parallelen zu den Koordinatenachsen angeordnet sein. Dabei bezeichnet R2h das gesamte den R2
überdeckende Punktgitter. Die Schnittpunkte der Gitterlinien mit dem Rand ∂Ω bilden dabei natürliche Stützpunkte für die Approximation der Randwerte. Die Gitterweite“ h hat auf
”
solchen Gittern eine natürliche Bedeutung.
Ω
Ωh
0
P
innere Knoten
✱
Ωh
Pseudo-Randknoten
Ω
Randknoten
h
h
Abbildung 2.1: Gitter für Differenzenapproximation
48
Die einfachste Approximation ∆h ≈ ∆ des Laplace-Operators verwendet zentrale Differenzenquotienten 2. Ordnung in jeder der Koordinatenrichtungen. Man erhält den sog. 5-Punkte”
Operator“:
n
o
1
(5)
∆h uh (x, y) := 2 u(x ± h, y) + u(x, y ± h) − 4u(x, y)
h
für innere Gitterpunkte P = (x, y) ∈ Ωh . Wir verwenden hier die Konvention, daß ... ± h”
”
abkürzend für die Summe der beiden Terme ... + h” und ... − h” steht. Die Konsistenzordnung
”
”
dieser Differenzenapproximation ist wegen der Äquidistanz des Gitters und der symmetrischen
Plazierung der Stützpunkte m = 2 :
(5)
|∆h u(P ) − ∆u(P )| ≤ 16 M4 (u)h2 ,
(2.1.11)
wobei M4 (u) := maxΩ {|∂xi ∂yj u|, i + j = 4} . Diese Aussage bleibt gültig, wenn das Gitter nur in
jeder einzelnen der Koordinatenrichtungen äquidistant ist. Dagegen ginge die Konsistenzordnung
auf m = 1 zurück, wenn das Gitter zwar kartesisch, aber innerhalb einer Koordinatenrichtung
nicht äquidistant wäre. Höhere Approximationsordnungen lassen sich z.B. auf einem gleichförmigen Gitter durch Hinzunahme von weiteren Punkten in der Umgebung des Auswertungspunkts
(x, y) erzielen:
i) Approximation der zweiten Ableitungen im Laplace-Operator durch zentrale Differenzenquotienten auf jeweils 5 Punkten ergibt den gestreckten“ 9-Punkte-Operator:
”
n
o
1
(9)
−
u(x
±
2h,
y)
+
16u(x
±
h,
y)
−
u(x,
y
±
2h)
+
16u(x,
y
±
h)
−
60u(x,
y)
.
∆h uh (x, y) =
12h2
Dieser Differenzenoperator hat offensichtlich die Konsistenzordnung m = 4 , doch hat die zugehörige Koeffizientenmatrix wegen des Vorzeichenwechsels ungünstige Eigenschaften.
ii) Der kompakte“ 9-Punkte-Operator verwendet neben dem Auswertungspunkt (x, y) die 8
”
direkten Nachbarpunkte (x ± h, y), (x ± h, y ± h), (x, y ± h) :
n
o
¯ (9) uh (x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) .
∆
h
6h2
Dieses Schema hat zunächst auch nur die Ordnung m = 2 , doch kann man es durch eine Modifikation bei der Auswertung der rechten Seite auf die Ordnung m = 4 bringen (Übungsaufgabe):
f (x, y) → f (x, y) +
1 2 (5)
12 h ∆h f (x, y).
(2.1.12)
Approximation entlang des Randes: Bei der Approximation am (möglicherweise gekrümmten) Rand des Gebiets gibt es verschiedene Möglichkeiten, die, wie wir später sehen werden,
durchaus auf unterschiedliche Approximationsordnungen führen. Wir betrachten wieder den 5Punkte-Operator und definieren zunächst die folgenden Gitterpunktmengen:
[
N (P ) \ Ωh .
Ωh := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ωh :=
P ∈Ωh
i) Konstante Randwertextrapolation: In Punkten von Ωh wird der 5-Punkte-Operator angesetzt,
und in Punkten P ∈ ∂Ωh werden die Randwerte uh (P ) = g(P 0 ) verwendet. Dabei ist P 0 der
P entlang einer der Koordinatenachsen am nächsten gelegene Punkt auf ∂Ω . Dies ergibt entlang
des Randes nur eine Approximationsordnung m = 1 .
49
Ω
P0
P
Abbildung 2.2: Schema der konstanten Randapproximation
ii) Lineare Randwertinterpolation: Jeder Punkt P ∈ ∂Ωh liegt in x- und/oder y-Richtung
zwischen zwei Punkten P0 ∈ ∂Ω und P1 ∈ Ωh mit Abständen 0 ≤ αh < h zu P0 und h zu
P1 . Man setzt dann (lineare Interpolation):
uh (P ) :=
1 g(P0 ) + αuh (P1 ) .
1+α
(2.1.13)
Damit wird eine implizite Kopplung der Randwerte an die inneren“ Lösungswerte bewirkt.
”
Diese Randwertapproximation hat die Ordnung m = 2 .
Ω
P0
P
P1
Abbildung 2.3: Schema der linearen Randapproximation
iii) Shortley1 -Weller2 -Approximation: Wir definieren die folgenden Punktmengen:
[
N (P ) \ Ωh ,
Ω0h := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ω∗h :=
P ∈Ω0h
Ωh := Ω0h ∪ ∂Ω∗h ,
∂Ωh := {Schnittpunkte der Gitterlinien mit ∂Ω}.
In Punkten P ∈ Ωh wird wieder der normale 5-Punkte-Operator und in den fiktiven“ Rand”
punkten P ∈ ∂Ω∗h der modifizierte 5-Punkte-Operator verwendet (siehe die schematische Darstellung):
n 2
2
2
2
uh (x, y) −
uh (x + h, y) −
uh (x − αh, y)
α β
1+α
α(1 + α)
o
2
2
uh (x, y + h) −
uh (x, y − βh) = f (x, y) ,
−
1+β
β(1 + β)
−∆∗h uh (x, y) := h−2
1
2
George Shortley (1910-: ????
R. Weller (????-????): ????
+
50
gemäß
−∆∗h uh = f
auf ∂Ω∗h ,
(2.1.14)
mit den Werten uh (P ) := g(P ) auf ∂Ωh . Für diesen Differenzenoperator gilt
|∆∗h u(P ) − ∆u(P )| ≤ 23 M3 (u)h,
(2.1.15)
wobei M3 (u) := maxΩ {|∂xi ∂yj u|, i + j = 3} .
(x, y+h)
h
h Gitterweite
αh
(x, y)
(x+2h, y)
h
(x- αh, y)
(x+h, y)
(x, y) Stützpunkt
0 < α, β ≤ 1, αβ < 1
βh
(x, y- βh)
Abbildung 2.4: Schema der Shortley-Weller-Approximation
Die Verwendung dieser Differenzenapproximationen führt auf Schemata der Form
L h uh = f h
in Ωh ,
Rh uh = gh
auf ∂Ωh ,
(2.1.16)
wobei der Randoperator“ Rh die jeweilige Randwertapproximation beschreibt. Dabei wer”
den die echten Randwerte von uh auf ∂Ωh unter Umständen implizit mit Werten im Innern
verkoppelt. In diesem Fall sind alle Werte uh (P ), P ∈ Ωh , zu bestimmen. Der Differenzenoperator Lh steht für den normalen 5-Punkte-Operator in Ωh und gegebenfalls den modifizierten
Shortley-Weller-Operator auf ∂Ω∗h . Im einfachsten Fall der trivialen Randwertapproximation
Rh uh = uh können die Randwerte uh (P ) = gh (P ), P ∈ ∂Ωh , direkt eliminiert werden. Wir
werden im folgenden nur diesen Fall weiter diskutieren.
Bemerkung: Die obigen Differenzenschemata haben natürliche Analoga in drei Raumdimensionen. Man spricht dann aus naheliegendem Grund vom 7-Punkte-Operator“. Dessen Abschnei”
defehler genügt der Abschätzung
(7)
|∆h u(P ) − ∆u(P )| ≤ 14 M4 (u)h2 .
(2.1.17)
2.2 Eigenschaften der Differenzengleichungen
51
Ausgangspunkt der folgenden Untersuchungen ist das Differenzenschema der Gestalt
X
Lh uh (P ) :=
σ(P, Q)uh (Q) = fh (P ), P ∈ Ωh ,
(2.2.18)
Q∈N (P )
uh (P ) = gh (P ), P ∈ ∂Ωh ,
(2.2.19)
mit geeigneten Approximationen fh (·) zu f und gh (·) zu g . Wir definieren die Koeffizenten
σ(P, Q) := 0 für Punkte Q 6∈ N (P ). Für P ∈ Ωh gilt dann
X
X
σ(P, Q)uh (Q) = fh (P ) −
σ(P, Q)gh (Q).
(2.2.20)
Q∈Ωh
Q∈∂Ωh
Bei (beliebiger) Numerierung der Gitterpunkte etwa gemäß Ωh = {Pn , n = 1, ..., N } , ∂Ωh =
{Pn , n = N + 1, ..., N + M } ergibt sich ein quadratisches Gleichungssystem für den Vektor der
(inneren) Knotenwerte U = (Un )N
n=1 , Un := uh (Pn ) :
AU = F,
(2.2.21)
N
mit A = (Anm )N
n,m=1 , F = (Fn )n=1 , wobei
Anm := σ(Pn , Pm ),
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Fn := fh (Pn ) −
NX
+M
σ(Pn , Pm )gh (Pm ).
m=N +1
h=
1
m+1
N = m2
Gitterweite
innere“ Gitterpunkte
”
h
h
Abbildung 2.5: Differenzengitter
Beispiel ( Modellproblem”): Im Fall des Einheitsquadrats Ω
”
5-Punkte-Operator bei zeilenweiser Durchnumerierung des Gitters
dünn-besetzte Matrix der Dimension N = m2 :




Bm −Im
4







 −1
1 
 −Im Bm −Im


A= 2 
N
Bm = 
.. 



h 
. 
−Im Bm





.. ..

.
.
= (0, 1)2 ergibt sich für den
Ωh = {Pij }m+1
i,j=0 die folgende








4 −1

.  m
−1
4 .. 




.. ..

.
.
−1
52
mit der m×m-Einheitsmatrix Im . Die rechte Seite ist F := (f (x11 ), . . . , f (xmm ))T . Die Matrix
A ist eine dünn besetzte Bandmatrix mit der Halbbandbreite m , symmetrisch und (irreduzibel)
diagonal-dominant. Damit ist sie auch regulär und positiv definit.
Bemerkung: In drei Raumdimensionen hat die entsprechende Matrix die Dimension N = m3
und die Halbbandbreite m2 . Ansonsten hat sie dieselben Eigenschaften wie in zwei Dimensionen.
Im allgemeinen Fall ist für moderates rP die Matrix A dünn besetzt, aber häufig wegen
der Randwertapproximation nicht symmetrisch. Dies wäre ein schwerwiegender Nachteil, etwa
bei der Approximation von Eigenwertaufgaben zum Laplace-Operator. Um die Regularität von
A bzw. die Lösbarkeit der Differenzengleichung garantieren zu können, formulieren wir die
folgenden Strukturbedingungen in numerierungs-unabhängiger Form:
(B1) Erweiterte Diagonaldominanz: Für Punkte P ∈ Ωh gilt:
X
|σ(P, Q)| ≤ |σ(P, P )| ,
(i)
(2.2.22)
Q∈Ωh , Q6=P
und für Punkte P ∈ Ω∗h := {Q ∈ Ωh : N (Q) ∩ ∂Ωh 6= ∅} :
X
(ii)
Q∈Ωh , Q6=P
|σ(P, Q)| < |σ(P, P )| .
(2.2.23)
(B2) Nicht-negativer Typ: Für Punkte P ∈ Ωh und Q ∈ Ωh \ {P } gilt:
σ(P, P ) > 0,
σ(P, Q) ≤ 0 .
(2.2.24)
(B3) Zusammenhang: Es ist ∂Ωh 6= ∅ , und mit N (P ) := {Q ∈ Ωh , σ(P, Q) 6= 0} gilt für jede
echte Teilmenge Sh ⊂ Ωh :
[
N (P ) ∩ (Ωh \ Sh ) 6= ∅ .
(2.2.25)
P ∈Sh
Die ersten beiden Bedingungen (B1) und (B2) werden von vielen Differenzenschemata, insbesondere solchen höherer als zweiter Ordnung (z.B.: der gestreckte” 9-Punkte-Operator), nicht
”
erfüllt. Die hier betrachteten 5-Punkte-Schemata mit Randapproximation genügen ihnen aber.
Wir zeigen im folgenden, wie bei den einzelnen Randapproximationen die Bedingung (B1ii)
erfüllt ist.
i) Konstante Randwertextrapolation: Für P ∈ Ω∗h gilt
X
|σ(P, Q)| ≤ 3h−2 =
Q∈Ωh , Q6=P
3
4
|σ(P, P )| ,
ii) Lineare Randwertinterpolation: Für P ∈ Ω∗h gilt
X
−2 7 −2
α
h ≤ 2h ≤
|σ(P, Q)| ≤ 3 + 1+α
Q∈Ωh , Q6=P
7
8
|σ(P, P )| ,
53
iii) Shortley-Weller-Randwertapproximation: Für P ∈ Ω∗h gilt
X
Q∈Ωh , Q6=P
|σ(P, Q)| ≤
2
1+α
+
2
1+β
h−2 ≤
2
α
1
2
+
2
β
h−2 =
1
2
|σ(P, P )| .
Die dritte Bedingung (B3) sichert die Kopplung eines jeden inneren Gitterpunktes P ∈ Ωh
mit allen anderen, insbesondere mit den Randpunkten. Die Eigenschaft des kontinuierlichen
Problems, daß sich eine kleine Störung in einem Punkt global bemerkbar macht, spiegelt sich
hier wider.
Die obigen Eigenschaften des Differenzenschemas korrespondieren zu den bereits bekannten
der zugehörigen Koeffizientenmatrix A . Unabhängig von der gewählten Numerierung der Gitterpunkte implizieren die Bedingungen (B1) und (B3) zunächst die einfache Diagonaldominanz von
A , darüber hinaus aber auch die stärkere irreduzible Diagonaldominanz” (analog dem schwa”
”
chen Zeilensummenkriterium“ für die Konvergenz des Jacobi- oder des Gauß-Seidel-Verfahrens).
Die Bedingung (B2) entspricht einer analogen für A .
Um Existenz und Eindeutigkeit einer Lösung für das allgemeine Differenzenschema garantieren zu können, geht man ähnlich wie im Kontinuierlichen vor und nutzt ein diskretes Analogon
des Maximumprinzips”.
”
Satz 2.1 (Diskretes Maximumprinzip): Wenn die Bedingungen (B1i), (B2) und (B3) erfüllt
sind, genügt das zugehörige Differenzenschema einem diskreten Maximumprinzip“, d.h.: Git”
terfunktionen uh mit der Eigenschaft
Lh uh (P ) ≤ 0,
P ∈ Ωh ,
(2.2.26)
haben in Ωh kein positives Maximum. Genauer gilt uh ≤ 0 auf Ωh oder
max uh ≤ max uh .
∂Ωh
Ωh
(2.2.27)
Beweis: Wir nehmen an, daß (2.2.26) für ein uh erfüllt ist, und führen den Beweis indirekt. Es
gebe also einen Punkt P0 ∈ Ωh , so daß
M := uh (P0 ) = max uh > 0,
Ωh
max uh < M.
∂Ωh
Ausgehend von Lh uh (P ) ≤ 0 , folgt mit Bedingung (B2):
X σ(P ,Q) X σ(P ,Q)
0
0 uh (Q)
u
(Q)
=
uh (P0 ) ≤ −
h
σ(P0 ,P0 )
σ(P0 ,P0 )
Q6=P0
Q6=P0
X σ(P ,Q) X σ(P ,Q) 0 uh (P0 ) +
0 {uh (Q) − uh (P0 )}.
=
σ(P0 ,P0 )
σ(P0 ,P0 )
Q6=P0
Q6=P0
Weiter gilt wegen Bedingung (B1i)
X σ(P ,Q) 0 ≤ 1,
σ(P0 ,P0 )
Q6=P0
54
und folglich ( uh (P0 ) = M )
M ≤M+
X
σ(P0 ,Q) {uh (Q) − M }.
σ(P0 ,P0 )
Q∈N (P0 )\{P0 }
Da nach Voraussetzung uh (Q) ≤ M ist, muss also uh (Q) = M in allen Punkten Q ∈ N (P0 )
(d.h. solchen mit σ(P0 , Q) 6= 0 ) sein, da sonst ein Widerspruch entsteht. Anwendung derselben
Schlußweise für alle Punkte in N (P0 ) liefert
[
uh (Q) = M, Q ∈
N (P ).
P ∈N (P0 )
Mit Hilfe der Bedingung (B3) erschließen wir dann durch sukzessive Fortsetzung dieses Arguments, daß uh ≡ M auf Ωh . Nach Voraussetzung ist ∂Ωh 6= ∅ , so daß es wegen (B3) einen
Punkt Q ∈ ∂Ωh ∩ N (P ) mit einem inneren“ Punkt P ∈ Ωh geben muß. Für diesen folgt dann
”
uh (Q) = M , was im Widerspruch zur Annahme max∂Ωh uh < M steht.
Q.E.D.
Das diskrete Maximumprinzip hat eine Reihe von wichtigen Folgerungen für die obigen Differenzenschemata.
Korollar 2.1 (Eindeutigkeit): Unter den Voraussetzungen (B1), (B2) und (B3) besitzt das
Differenzenschema (2.2.18), (2.2.19) genau eine Lösung uh . Im Falle fh ≥ 0 folgt aus gh ≥ 0
auch uh ≥ 0 .
Beweis: i) Wegen der Äquivalenz von (2.2.18), (2.2.19) zu dem Gleichungssystem Ah U = Fh
(1)
(2)
genügt es, die Eindeutigkeit zu zeigen. Seien also uh und uh zwei Lösungen:
(i)
L h uh = f h
(1)
in Ωh ,
(i)
uh = gh
auf ∂Ωh .
(2)
Für die Differenz wh := uh − uh gilt dann
Lh wh = 0
in Ωh ,
wh = 0 auf ∂Ωh .
Nun wird das diskrete Maximumprinzip auf Lh wh ≤ 0 sowie auf Lh (−wh ) ≤ 0 angewendet.
Ersteres ergibt wh ≤ 0 und letzteres wh ≥ 0 und folglich wh ≡ 0 .
ii) Sei nun fh ≥ 0 und gh ≥ 0 . Dann impliziert das diskrete Maximumprinzip angewendet für
−uh , daß entweder uh ≥ 0 oder minΩh uh = − maxΩh (−uh ) ≥ − max∂Ωh (−gh ) = min∂Ωh gh ,
was zu beweisen war.
Q.E.D.
Im nächsten Abschnitt werden wir das diskrete Maximumprinzip verwenden, um die stetige
Abhängigkeit der Lösungen von den Problemdaten zu zeigen. Dies wird sich als Nebenprodukt
einer sehr viel stärkeren Stabilitätsungleichung ergeben.
Korollar 2.2 (Inverse Monotonie): Unter den Voraussetzungen (B1), (B2) und (B3) ist die
zum Differenzenoperator Lh bei beliebiger Numerierung der Gitterpunkte gehörende Koeffizientenmatrix A eine sog. M-Matrix” (invers-monotone Matrix), d.h.: Ihre Inverse A−1 ist
”
elementweise nicht negativ:
A−1 ≥ 0.
(2.2.28)
55
Beweis: Die Matrix A wird wie üblich geschrieben als Summe A = L + D + R einer linken unteren Dreiecksmatrix L , einer Diagonalmatrix D und einer rechten oberen Dreiecksmatrix R .
Die Bedingungen (B1), (B2) und (B3) implizieren, wie oben bereits bemerkt, die (irreduzible)
Diagonaldominanz von A und damit 1) die Regularität von A und D und 2) die Kontraktivität spr(J) < 1 der Jacobi-Matrix J := −D−1 (L + R) . Dann existiert eine (natürliche)
Matrizennorm k · k , bzgl. derer kJk < 1 ist. Hiermit folgt die Existenz der Reihe (im Sinne der
Matrizenkonvergenz)
∞
X
J k = (I − J)−1 .
k=0
Bedingung (B2) garantiert, daß (elementweise) J = −D−1 (L + R) ≥ 0 und folglich auch
A−1 D = (D −1 A)−1 = (I + D −1 (L + R))−1 = (I − J)−1 =
∞
X
k=0
Wegen D−1 ≥ 0 impliziert dies A−1 ≥ 0 .
J k ≥ 0.
Q.E.D.
Die Matrix A−1 ordnet der rechten Seite fh und den Randwerten gh eindeutig den Lösungsvektor U der Differenzengleichung zu:
A−1 : {fh , gh } → U = A−1 F (fh , gh ).
Damit ist A−1 das algebraische Äquivalent der kontinuierlichen Greenschen Funktion G(·, ·) :
Z
Z
∂n G(x, y)g(y) dy.
G(x, y)f (y) dy −
G : {f, g} → u(x) =
∂Ω
Ω
Als Folgerung des Maximumprinzips ist G(x, y) ≥ 0, x 6= y , was analog zur gerade gezeigten
Eigenschaft A−1 ≥ 0 ist.
2.2.1 Das Konvergenzverhalten von Differenzenverfahren
Die Grundlage der Fehleranalyse für die oben eingeführten Differenzenschemata ist wie im Fall
von Differenzenverfahren für gewöhnliche Differentialgleichungen eine asymptotische Stabilitätsabschätzung. Wir formulieren diese im folgenden Satz für ein allgemeines Differenzenschema
Lh uh = fh
in Ωh ,
uh = gh
auf ∂Ωh .
(2.2.29)
Wir setzen im folgenden stets voraus, daß dieses Schema konsistent ist.
Satz 2.2 (Stabilität): Das Differenzenschema (2.2.29) sei konsistent und genüge den Bedingungen (B1), (B2) und (B3). Dann gilt für jede Gitterfunktion uh die Stabilitätsabschätzung
max |uh (P )| ≤ 14 d2Ω max |Lh uh (P )| + max |uh (P )| ,
P ∈Ωh
wobei dΩ := diam(Ω) .
Ωh
P ∈∂Ωh
(2.2.30)
56
Beweis: Wir argumentieren im folgenden ähnlich wie auf der kontinuierlichen Ebene. Durch die
folgende Vorschrift für beliebiges, festes Q ∈ Ωh
Lh Gh (·, Q) = h−2 δ(·, Q)
in Ωh ,
Gh (·, Q) = δ(·, Q)
auf ∂Ωh ,
(2.2.31)
wird ein diskretes Analogon Gh (P, Q) : Ωh × Ωh → R zur kontinuierlichen Greenschen Funktion
(des Laplace-Operators) definiert. Dabei ist δ(P, Q) das übliche Kronecker3 -Symbol”. Aus
”
dem diskreten Maximumprinzip folgt, daß Gh (P, Q) ≥ 0 .
Für eine Gitterfunktion vh gilt dann die diskrete Greensche Identität”
”
X
X
Gh (P, Q)Lh vh (Q) +
Gh (P, Q)vh (Q), P ∈ Ωh .
vh (P ) = h2
Q∈Ωh
(2.2.32)
Q∈∂Ωh
Um dies zu sehen, bezeichnen wir die rechte Seite von (2.2.32) mit wh und erhalten mit den
Eigenschaften der Greenschen Funktion
Lh wh = Lh vh
in Ωh ,
wh = vh
auf ∂Ωh .
Die Eindeutigkeit der Lösungen des Diffenzenschemas impliziert dann wh ≡ vh .
Aus der diskreten Greenschen Identität folgt für jede Gitterfunktion vh
X
X
Gh (P, Q) max |Lh vh | +
Gh (P, Q) max |vh |, P ∈ Ωh .
|vh (P )| ≤ h2
Q∈Ωh
Ωh
Q∈∂Ωh
∂Ωh
(2.2.33)
i) Wegen der Konsistenz des Schemas gilt für die Gitterfunktion wh ≡ 1 notwendig Lh wh ≡ 0 ,
so daß aus der Greenschen Identität folgt:
X
X
X
Gh (P, Q)Lh wh (Q) +
1 = h2
Gh (P, Q)wh (Q) =
Gh (P, Q) .
(2.2.34)
Q∈Ωh
Q∈∂Ωh
Q∈∂Ωh
Dies impliziert eine Schranke für die zweite Summe in (2.2.33).
ii) Jeder Punkt P0 ∈ Ωh ist Mittelpunkt eines Ω enthaltenden Kreises mit Radius dΩ . O.b.d.A.
sei hier P0 = 0 . Für die Funktion w(P ) := 14 |P |2 gilt in Punkten P ∈ Ωh :
Lh w(P ) = Lh w(P ) + ∆w(P ) − ∆w(P ) = M3 (w)O(h) − ∆w(P ) = −1,
da M3 (w) = 0. Wir definieren nun die Gitterfunktion
X
Gh (P, Q).
vh (P ) := h2
Q∈Ωh
Durch elementares Nachrechnen verifiziert man, daß
Lh vh = 1
in Ωh ,
vh = 0 auf ∂Ωh ,
Lh (vh + w) = 0
in Ωh ,
vh + w ≤ 14 d2Ω
auf ∂Ωh .
3
Leopold Kronecker (1823-1891): deutscher Mathematiker; wirkte in Berlin als “Privatgelehrter”; betrieb die
Arithmetisierung der Mathematik; wichtiger Vertreter des “Konstruktivismus”, welcher die generelle Verwendung
des Widerspruchsbeweises und des “aktual Unendlichen” in Form z.B. der allgemeinen reellen Zahlen ablehnt.
57
Aus dem diskreten Maximumprinzip folgt dann wegen w ≥ 0 notwendig
max vh ≤ max (vh + w) ≤ max (vh + w) = max w ≤ 14 d2Ω ,
Ωh
∂Ωh
∂Ωh
Ωh
und somit
h2
X
Q∈Ωh
Gh (P, Q) ≤ 14 d2Ω ,
P ∈ Ωh .
(2.2.35)
Die Abschätzungen (2.2.34) und (2.2.35) ergeben zusammen mit (2.2.33) die Behauptung. Q.E.D.
Als unmittelbare Folgerung aus Satz 2.2 erhalten wir (in Analogie zum kontinuierlichen Fall)
die stetige Abhängigkeit der Lösung von den Daten. Das wichtigste Resultat ist eine a priori
Konvergenzabschätzung für das Differenzenschema (2.2.29).
Korollar 2.3 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für das Differenzenschema (2.2.29) die a priori Konvergenzabschätzung
max |eh (P )| ≤ 14 d2Ω max |τh (P )| + max |eh (P )|,
P ∈Ωh
P ∈Ωh
P ∈∂Ωh
(2.2.36)
mit dem Fehler eh = u − uh und dem Abschneidefehler τh (P ) := Lh u(P ) + ∆u(P ) .
Beweis: Für den Fehler eh gilt die Differenzengleichung
Lh eh (P ) = τh (P )
P ∈ Ωh ,
so daß die Stabilitätsungleichung (2.2.30) unmittelbar die Behauptung liefert.
Q.E.D.
Die Abschätzung (2.2.36) garantiert wieder, daß für ein gutes“ Differenzenschema der globale
”
Diskretisierungsfehler mit derselben Ordnung wie der lokale Abschneidefehler konvergiert. Wir
wollen diese allgemeinen Resultate für die obigen speziellen Diskretisierungen anwenden. Dabei
wird wieder die folgende Bezeichnung für Normschranken der exakten Lösung verwendet:
Mm (u) := max{|∂xi ∂yj u|, i + j = m}.
Ω
Korollar 2.4 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den Fehler den
5-Punkte-Operator mit konstanter Randwertextrapolation die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
24 dΩ M4 (u)h
+ M1 (u)h.
Beweis: Für den Abschneidefehler gilt
max |τh | ≤ 16 M4 (u)h2 ,
Ωh
und in Randgitterpunkten
max |eh | = max |u(P ) − u(P ⋆ )| ≤ M1 (u)h.
∂Ωh
∂Ωh
(2.2.37)
58
Die Stabilitätsabschätzung (2.2.30) impliziert damit die Behauptung.
Q.E.D.
Der ordnungsreduzierende Effekt der mangelhaften Randwertapproximation kann durch die
oben beschriebene lineare Randwertinterpolation“ behoben werden. Für das so modifizierte
”
5-Punkte-Schema erhält man ähnlich wie eben die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
12 dΩ M4 (u)h
+ 21 M2 (u)h2 .
(2.2.38)
Korollar 2.5 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den modifizierten 5-Punkte-Operator nach Shortley-Weller die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
24 dΩ M4 (u)h
+ 31 M3 (u)h3 .
(2.2.39)
Beweis: Für den Fehler eh gelten die Beziehungen
−∆h eh = τh in Ωh ,
−∆∗h eh = τh∗ auf ∂Ω∗h ,
eh = 0 auf ∂Ωh .
Für die Abschneidefehler gilt
|τh∗ | ≤ 32 M3 (u)h.
max
∗
max |τh | ≤ 16 M4 (u)h2 ,
Ωh
∂Ωh
In diesem Fall können wir nicht direkt die Stabilitätsungleichung (2.2.30) anwenden, da sie nur
auf eine reduzierte Konvergenzordnung O(h) führen würde. Statt dessen modifizieren wir in
geeigneter Weise den Beweis dieser Abschätzung. Mit den Bezeichnungen des Beweises von Satz
2.2 ergibt die Greensche Identität ( eh = 0 auf ∂Ωh )
X
X
Gh (P, Q)τh (Q) + h2
eh (P ) = h2
Gh (P, Q)τh∗ (Q)
Q∈Ω0h
Q∈∂Ω∗h
und folglich
|eh (P )| ≤ h2
X
Q∈Ω0h
Gh (P, Q) max |τh | + h2
Ω0h
X
Q∈∂Ω∗h
|τh∗ | .
Gh (P, Q) max
∗
∂Ωh
Wie im Beweis von Satz 2.2 folgt
X
X
Gh (P, Q) ≤ 14 d2Ω .
Gh (P, Q) ≤ h2
h2
Q∈Ω0h
(2.2.40)
(2.2.41)
Q∈Ωh
Wir wollen jetzt zeigen, daß
X
Q∈∂Ω∗h
Gh (P, Q) ≤
1
2
.
Dazu definieren wir die Gitterfunktion wh durch
wh = 1 in Ωh ,
wh = 0 auf ∂Ωh .
(2.2.42)
59
Für diese verifiziert man durch Nachrechnen
−∆h wh = 0 in Ω0h ,
−∆∗h wh ≥ 2h−2 auf ∂Ω∗h .
Mit Hilfe der Greenschen Identität folgt damit
X
X
1 = h2
Gh (P, Q)(−∆∗h )wh (Q) ≥ 2
Gh (P, Q),
Q∈∂Ω∗h
was (2.2.42) impliziert. Dies vervollständigt den Beweis.
Q∈∂Ω∗h
Q.E.D.
Bemerkung: In drei Raumdimensionen gelten Satz 2.2 und Korollar 2.3 mit der Konstante 61 d2Ω . Hiermit und der zugehörigen Abschätzung (2.1.17) für den Konsistenzfehler ergeben
sich dann auch die a priori Fehlerabschätzungen der Korollare 2.4 und 2.4 mit der führenden
1 2
dΩ .
Konstante 24
Bemerkung: Wir betonen, daß die Konvergenz der betrachteten Differenzenschemata eine vergleichsweise hohe Regularität der zu approximierenden Lösung erfordert. Das Shortley-WellerSchema erfordert z.B. für seine maximale“ Konvergenzordnung m = 2 , daß u beschränkte
”
vierte Ableitungen auf ganz Ω besitzt ( M4 (u) < ∞ ). Dies ist eine sehr einschneidende Forderung, wie wir im vorigen Kapitel gesehen haben. Sie kann i.a. nur für glatt berandete Gebiete
sowie unter gewissen Zusatzbedingungen für spezielle Geometrien wie z.B. Rechtecke garantiert werden. Weiter erfordert sie auch hohe Glattheit der Daten f und g . Auf Gebieten mit
einspringenden Ecken oder sonstwie reduzierter Regularität von u können diese Sätze nicht verwendet werden. In solchen realitätsnäheren Situationen werden sich die im nächsten Abschnitt
behandelten Finite-Elemente-Verfahren“ als flexibler erweisen.
”
60
2.3 Lösungsaspekte
Wir diskutieren nun die Lösung der durch eine Differenzendiskretisierung entstehenden algebraischen Gleichungssysteme. Zugrunde gelegt wird die Situation des Modellproblems der 1. RWA
des Laplace-Operators
Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(2.3.43)
auf einem Gebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen
Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form
Ax = b,
(2.3.44)
N
Die Matrix A = (anm )N
n,m=1 und der Vektor b = (bn )n=1 haben die Dimension N := Anzahl
der inneren Gitterpunkte bzw. Knotenfreiheitsgrade. In der Praxis ist meist N ≫ 1000 , so daß
neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Die Matrix ist
extrem dünn besetzt und besitzt abhängig von der gewählten Numerierung der Gitterpunkte
bzw. Knoten eine Bandstruktur. Für die Wahl eines geeigneten (d.h.: möglichst sparsamen)
Lösungsverfahrens ist die zu erwartende Dimension N entscheidend.
Wir orientieren die folgende Diskussion an der Modellsituation der Poisson-Gleichung auf
dem Einheitsquadrat Ω = (0, 1)2 und der Diskretisierung mit dem üblichen 5-Punkte-Schema
Ωh = Ωh ∪ ∂Ωh der Gitterweite h . Das Gebiet
auf einem äquidistanten, kartesischen Gitter
√
Ω = (0, 1)2 hat den Durchmesser dΩ = 2 . Wir wählen die Funktion u(x, y) = sin(πx) sin(πy)
als Lösung der Randwertaufgabe
−∆u = 2π 2 u =: f
in Ω,
u = 0 auf ∂Ω.
(2.3.45)
Es ist M4 (u) = π 4 . Die a priori Fehlerschranke (2.2.39) für die Shortley-Weller-Approximation
liefert damit die (pessimistische) Fehlerschätzung
max |u − uh | ≈
Ωh
1 2 4 2
24 dΩ π h
≈ 8h2 .
(2.3.46)
Zur Erreichung garantierter 3-stelliger (relativer) Genauigkeit, TOL = 10−3 , ist in diesem Fall
also eine Gitterweite h ≈ 10−2 erforderlich. Dies führt auf ein (symmetrisches) Gleichungssystem
der Dimension N ≈ 104 .
Bemerkung 2.1: Die Fehlerabschätzung (2.3.46) ist in der Tat sehr pessimistisch. Der wirkliche
Fehler ist ungefähr um einen Faktor 10−1 kleiner. Dies zeigt, daß unsere a priori Fehleranalyse
selbst für ein so einfaches Modellproblem zu unscharf und für praktische Zwecke nur bedingt
brauchbar ist.
√
2) In drei Raumdimensionen ist dΩ = 3 , und die a priori Fehlerabschätzung (2.3.46) liefert
den Wert ≈ 12h2 , so daß hier mindestens auch h = 10−2 und damit N ≈ 106 erforderlich
wäre.
Die Struktur der Matrix A hängt von der gewählten Numerierung der Gitterpunkte ab. Die
gängigen Alternativen sind:
61
Zeilenweise Numerierung: Die lexikographische Anordnung der Gitterpunkte, (xi , yj ) ≤ (xp , yq ) ,
wenn j ≤ q oder j = q, i ≤ p führt auf eine Bandmatrix mit Bandbreite 2m + 1 ≈ h−1 .
21 22 23
24
25
16
17 18
19
20
11
12 13
14
15
6
7
8
9
10
1
2
3
4
5
Abbildung 2.6: Lexikographische Nummerierung
Diagonale Numerierung: Die sukzessive Numerierung diagonal zu den Koordinatenrichtungen
führt auf eine Bandmatrix mit geringem Bandinhalt“ (⇒ Speicherersparnis beim Gaußschen
”
Eliminationsverfahren).
11 16 20
7
12 17
23 25
21
24
4
8 13 18
22
2
5
9
14
19
1
3
6
10
15
Abbildung 2.7: Diagonale Nummerierung
Schachbrett-Numerierung: Die versetzte zeilenweise- sowie spaltenweise Numerierung führt auf
eine 2 × 2-Blockmatrix mit diagonalen Hauptblöcken.
11
21
6
16
1
24 12
25
13
9 22 10
23
19
7
20
8
4 17
5
18
15
3
14
2
Abbildung 2.8: Schachbrett-Nummerierung
62
a) Direkte Lösung: Prinzipiell wäre das klassische Gaußsche Eliminationsverfahren zur Lösung
des Systems (2.3.44) geeignet. Zu seiner Durchführung benötigt man bei zeilenweiser Numerierung und Ausnutzung der Symmetrie etwa mN Speicherplätze (im folgenden abgekürzt
als SP“) und m2 N arithmetische Operationen (im folgenden abgekürzt als OP“). Im Fal”
”
le N ≈ 104 sind dies etwa 106 SP und 108 OP. Die kurze Überschlagsrechnung zeigt, daß
direkte Lösungsmethoden für das Gleichungssystem (2.3.44) nur in speziellen Situationen in
Frage kommen. Sie spielen eine Rolle bei geringer Problemgröße ( N ≤ 103 ) oder im Falle sehr
uniformer Matrixeinträge (bei der Approximation von Differentialoperatoren mit konstanten
Koeffizienten) ( N ≤ 105 ). Speziell für die 5-Punkte-Approximation des Laplace-Operators auf
Rechtecken gibt es sehr effiziente direkte Lösungstechniken auf Grundlage der schnellen Fourier”
Transformation“ ( N ≤ 107 ). Diese sind aber bei allgemeineren Problemstellungen meist nicht
anwendbar und werden daher hier nicht weiter diskutiert.
Bemerkung: Zur Illustration machen wir dieselbe Überschlagsrechnung auch für die entsprechende dreidimensionale Situation Ω = (0, 1)3 . Hier hat die Matrix A die Dimension N = m3 ≈ 106
und die Bandbreite 2m2 + 1 ≈ 104 . Folglich betrüge der benötigte Lösungsaufwand ≈ 1010 SP
und ≈ 1014 OP, was jenseits der Kapazität normaler Arbeitsplatzrechner liegt.
b) Iterative Lösung: Wie bereits erwähnt, übertragen sich die wichtigen Eigenschaften (B1),
(B2) und (B3) des Differenzenschemas unabhängig von der gewählten Numerierung auf die jeweilige Matrix A . Diese ist (irreduzibel) diagonaldominant und von nichtnegativem Typ und
folglich eine M-Matrix, d.h.: Es gilt elementweise A−1 ≥ 0 . Zusätzlich ist A oft auch symmetrisch und positiv definit. In diesem Falle sind die meisten gängigen iterativen Verfahren
konvergent. Ausgehend von einer Defektkorrekturiteration
dt = F − Axt ,
Cv t = dt ,
xt+1 = xt + v t ,
(2.3.47)
mit einer regulären Matrix C ( Vorkonditionierer“) wird die Iteration zunächst als Fixpunkti”
teration geschrieben
Cxt+1 = Cxt + b − Axt
⇔
xt+1 = (I − C −1 A)xt + C −1 b.
(2.3.48)
Für den Fehler e(t) := x(t) − x gilt
e(t) = (I − C −1 A)x(t−1) + C −1 b − x
= (I − C −1 A)x(t−1) + C −1 b − (I − C −1 A)x − C −1 b
(2.3.49)
= (I − C −1 A)e(t−1) = · · · = (I − C −1 A)t e(0) .
Dies zeigt, daß die Iteration konvergiert, wenn die Iterationsmatrix“ B := I − C −1 A eine
”
Kontraktion ist, d.h.: ρ(B) := max{|λ|, λ Eigenwert von B} < 1 . Die Konvergenzrate“ der
”
Iteration ist dann gegeben durch
ρ :=
sup
x(0) ∈RN
lim
t→∞
kx(t) − xk 1/t
kx(0) − xk
= ρ(B).
(2.3.50)
Es ist dann näherungsweise
kx(t) − xk ≤ ρt kx(0) − xk.
(2.3.51)
Die Anzahl der zur Erreichung einer Reduktion des Anfangsfehlers um ε erforderlichen Iterati-
63
onsschritte ergibt sich damit zu
tε ≈
ln(ε)
.
ln(ρ)
(2.3.52)
Der Vorkonditionierer“ C sollte folgende Bedingungen erfüllen:
”
– einfache Invertierung (mit O(N ) OP und Speicherbedarf O(N ) SP);
– möglichst kleines ρ(I − C −1 A) .
Dies sind leider gegenläufige Zielsetzungen. Die einfachsten Verfahren dieses Typs verwenden
ausgehend von der natürlichen Aufspaltung A = L + D + R die Vorkonditionierer:
1. (Gedämpftes) Richardson4 -Verfahren: 0 < θ ≤ 2λmax (A)−1
B = I − θA.
(2.3.53)
B = −D −1 (L + R).
(2.3.54)
C = θI,
2. Jacobi5 -Verfahren (Gesamtschrittverfahren):
C = D,
3. Gauß-Seidel6 -Verfahren (Einzelschrittverfahren):
C = D + L,
B = −(D + L)−1 R.
(2.3.55)
4. SOR-Verfahren ( Successive Over-Relaxation“): ω = ωopt ∈ (0, 2)
”
C = D + ωL,
B = (D + ωL)−1 {(1 − ω)D − ωR}.
(2.3.56)
5. ILU-Verfahren ( Incomplete LU Decomposition“):
”
C = L̃R̃,
B = I − R̃−1 L̃−1 A.
(2.3.57)
Für eine symmetrische, positiv definite Matrix wird das ILU- zum ILLT -Verfahren ( In”
complete Cholesky7 Decomposition“). Die ILU-Zerlegung erhält man mit Hilfe des üblichen, rekursiven Prozesses zur Bestimmung der LU-Zerlegung aus der Gleichung LU = A
4
Lewis Fry Richardson (1881-1953): englischer Mathematiker und Physiker; wirkte an verschiedenen Institutionen in England und Schottland; typischer “angewandter Mathematiker”; leistete Pionierbeiträge zur Modellierung
und Numerik in der Wettervorhersage.
5
Carl Gustav Jakob Jacobi (1804-1851): deutscher Mathematiker; schon als Kind hochbegabt; wirkte in Königsberg und Berlin; Beiträge zu vielen Bereichen der Mathematik: zur Zahlentheorie, zu elliptischer Funktionen, zu
partiellen Differentialgleichungen, zu Funktionaldeterminanten und zur theoretischen Mechanik.
6
Philipp Ludwig von Seidel (1821-1896): deutscher Mathematiker; Prof. in München; Beiträge zur Analysis
(u.a. Methode der kleinsten Fehlerquadrate) owie Himmelsmechanik und Astronomie.
7
Andrè Louis Cholesky (1975-1918): französischer Mathematiker; Militärkarriere; Beiträge zur Numerischen
Linearen Algebra.
64
durch Nullsetzung aller Matrixeinträge zu Indexpaaren {n, m} mit anm = 0 :
n = 1, ..., N :
ũnm = anm −
˜
lnn = 1,
n−1
X
˜lni ũim
(m = 1, ..., N )
i=1
n−1
o
n
X
˜lij ũjn
˜lin = ũ−1 ain −
(i = n + 1, ..., N )
nn
j=1
˜lnm = 0, ũnm = 0, wenn anm = 0 .
6. ADI-Verfahren ( Alternating-Direction Implicit Iteration“):
”
C = (Ax + ωI)(Ay + ωI),
B = (Ay + ωI)−1 (ωI − Ax )(Ax + ωI)−1 (ωI − Ay ).
(2.3.58)
Das ADI-Verfahren ist für beliebige Wahl des Parameters ω > 0 konvergent. Wenn die
Struktur der Matrix seine Anwendung zuläßt, ist es bei optimaler Wahl von ω mindestens
so schnell wie das optimale SOR-Verfahren.
Die Konvergenzraten dieser einfachen Iterationsverfahren verhalten sich in Abhängigkeit von
der (gleichförmigen) Gitterweite wie
ρ = ρ(I − C −1 A) = 1 − O(hr ),
in Abhängigkeit von der Gitterweite h der Diskretisierung (bei fester Problemkonfiguration)
mit einem geeigneten r ≥ 0 . Die Anzahl T der zur Gewinnung einer Dezimalstelle Genauigeit
erforderlichen Iterationsschritte ist also ungefähr bestimmt durch
ρT ≈ 10−1
⇒
T≈−
ln(10)
≈ h−r .
ln(ρ)
(2.3.59)
Hierzu beachte man, daß ln(1 − chr ) = −chr + O(h2r ) . Da die Durchführung eines Iterationsschritts approximativ N ≈ h−2 OP (in zwei Raumdimensionen) kostet, ergibt sich ein
Gesamtaufwand pro Dezimalstelle an Genauigkeit von ≈ h−2−r OP. Der für die Durchführung
dieser Iterationsverfahren benötigte Speicherplatz entspricht etwa dem zur Speicherung der wesentlichen Elemente der Matrix A erforderlichen. Für das Jacobi- und Gauß-Seidel-Verfahren
ist r = 2 und für das (optimale) SOR-Verfahren ist r = 1 . Das ILU- und das ADI-Verfahren
liegen bei speziellen Konfigurationen etwa gleich auf zum SOR-Verfahren. Damit ergibt sich ein
Gesamtlösungsaufwand von jeweils O(N 2 ) bzw. O(N 3/2 ) a.Op. für die einzelnen Verfahren. Ein
wirklich effizientes“ Verfahren sollte ein möglichst kleines r aufweisen; optimal wäre r = 0 .
”
Dies läßt sich durch den Einsatz von sog. Multi-Level-Techniken“ ( Mehrgitterverfahren“) er”
”
reichen, welche später im Zusammenhang mit den Finite-Elemente-Diskretisierungen diskutiert
werden.
2.3.1 Aufwandsanalyse: ein Beispiel
Wir wollen das Konvergenzverhalten der bisher betrachteten Iterationsverfahren und deren sich
daraus ergebende Effizienz anhand des obigen Modellproblems eingehender diskutieren. Dabei
soll insbesondere die Bedeutung der Formel (2.3.59) für die Konvergenzrate illustriert werden.
65
Für die obige Modellsituation (5-Punkte-Differenzenoperator auf einem äquidistanden, kartesischen Gitter des Einheitsquadrats) lassen sich die Eigenwerte und zugehörigen Eigenvektoren
der Systemmatrix A explizit angeben. Für k, l = 1, . . . , m ergibt sich mit der Bezeichnung
Awkl = λkl wkl :
λkl = h−2 {4 − 2 (cos(khπ) + cos(lhπ))},
w
kl
k, l = 1, . . . , m,
= (sin(ikhπ) sin(jlhπ))i,j=1,...,m
(h = 1/(m + 1)) .
Also ist (für h ≪ 1)
λmax = h−2 {4 − 4 cos (1 − h)π} ≈ 8h−2 ,
λmin = h−2 {4 − 4 cos (hπ)} = h−2 {4 − 4 (1 − 12 π 2 h2 + O(h4 ))} ≈ 2π 2 .
und somit
κ := cond2 (A) ≈
4
π 2 h2
.
(2.3.60)
Die Eigenwerte der Jacobi-Matrix J = −D−1 (L + R) sind
µkl =
1
2
(cos(khπ) + cos(lhπ))
(k, l = 1, . . . , m)
Folglich wird
ρJ = µmax = cos(hπ) = 1 −
π2 2
h + O(h4 ) .
2
(2.3.61)
Für die Iterationsmatrizen des Gauß-Seidel- und des (optimalen) SOR-Verfahrens gilt dann
ρGS = ρ2GS = 1 − π 2 h2 + O(h4 ) ,
q
1 − 1 − ρ2J
1 − πh + O(h2 )
q
= 1 − 2 πh + O(h2 ) .
ρSOR =
=
2)
1
+
πh
+
O(h
1 + 1 − ρ2J
Für die Iterationszahlen (pro Dezimalstelle Fehlerreduktion) ergibt sich also asymptotisch:
TGS
TSOR
ln(10)
4, 6
≈
π 2 h2
1
2N,
ln(1 −
ln(10)
2, 3
≈−
≈ 2 2 ≈ 41 N ,
2
2
ln(1 − π h )
π h
√
2, 3
ln(10)
≈
≈ 13 N .
≈−
ln(1 − 2πh)
2πh
TJ ≈ −
π2 2
2 h )
≈
Der Vollständigkeit halber geben wir hier auch die entsprechenden Werte für das CG-Verfahren
( Verfahren der konjugierten Richtungen“):
”
√
√
3
≈ N.
TCG = 12 κ ln(20) ≈
πh
66
Das CG-Verfahren ist zwar langsamer als das optimale“ SOR-Verfahren, erfordert aber nicht
”
die Bestimmung eines Iterationsparameters.
Zum Vergleich der Effizienz der Iterationsverfahren muß natürlich auch der Aufwand pro
Iterationsschritt berücksichtigt werden. Für die Anzahl OP der arithmetischen Operationen pro
Iterationsschritt gilt (optimistische Schätzung)
OPJ , OPGS , OPSOR ≈ 6 N ,
OPCG ≈ 10 N .
Als Endresultat finden wir, daß zur Bestimmung der Lösung des diskretisierten Modellproblems das Jacobi-Verfahren, das Gauß-Seidel-Verfahren und das Gradientenverfahren O(N 2 )
OP benötigen. Das direkte Cholesky-Verfahren würde für die Berechnung der exakten“ Lösung
”
(auf Rundungsfehlergenauigkeit) ebenfalls O(m2 N ) = O(N 2 ) OP benötigen, erscheint also dem
Gauß-Seidel-Verfahren überlegen zu sein. Es ist jedoch zu berücksichtigen, daß letzteres nur
O(N ) SP benötigt, im Gegensatz zu den O(mN ) = O(N 3/2 ) SP für das Cholesky-Verfahren.
Die schnelleren, auf Mehrgitterkonzepten basierenden Iterationsverfahren sind dagegen dem einfachen direkten Löser asymptotisch klar überlegen.
Für das Beispiel mit N = 104 ergibt sich überschlagsmäßig der folgende Gesamtaufwand
GA“ zur sicheren Lösung des Systems (2.3.44) unter die Diskretisierungsgenauigkeit ( TOL =
” −3
10 , h = 10−2 , N = 104 ):
GAJ (TOL) ≈ 4 · 3N 2 ≈ 1, 2 · 109 OP ,
GAGS (TOL) ≈ 4 · 1, 5N 2 ≈ 6 · 108 OP ,
GASOR (TOL) ≈ 4 · 2N 3/2 ≈ 8 · 106 OP ,
GACG (TOL) ≈ 4 · 10N 3/2 ≈ 4 · 107 OP .
Für ein optimales“ Verfahren wie z.B. das Mehrgitterverfahren MG“ würde man hier wesent”
”
lich bessere Werte erwarten: GAM G (TOL) ≈ 4 · 25N ≈ 106 OP .
Bemerkung: In drei Raumdimensionen erhalten wir näherungsweise
λmax ≈ 12h−2 ,
λmin ≈ 3π 2 ,
κ ≈
8
,
3π 2 h2
und folglich im wesentlichen dieselben Abschätzungen für ρJ , ρGS und ρSOR sowie für die
Iterationszahlen TJ , TGS , TSOR und TCG wie im zweidimensionalen Fall. Der Aufwand für die
Durchführung eines Iterationsschritts ist hier OPJ , OPGS , OPSOR ≈ 8 N bzw. OPCG ≈ 12 N .
Für den Gesamtlösungsaufwand ergibt dies dann:
GAJ (TOL) ≈ 4 · 4N 2 ≈ 1, 6 · 1013 OP ,
GAGS (TOL) ≈ 4 · 2N 2 ≈ 8 · 1012 OP ,
GASOR (TOL) ≈ 4 · 3N 3/2 ≈ 1, 2 · 1010 OP ,
GACG (TOL) ≈ 4 · 12N 3/2 ≈ 4, 8 · 1010 OP .
Der Aufwand des Mehrgitterverfahrens erhöht sich aber nur vergleichsweise unwesentlich auf
GAM G (ε) ≈ 4 · 50N ≈ 2 · 108 OP .
Zur Bewertung dieser Komplexitätsschätzungen muß man sich die Leistung heutiger Rechner
vergegenwärtigen. Ein normaler Arbeitsplatzrechner leistet real etwa 200 MFlops (200 Millio-
67
nen Floating-Point“ Operationen pro Sekunde). Das SOR-Verfahren braucht dann auf einem
”
solchen Rechner zur Lösung des Gleichungssystems (auf Diskretisierungsfehlergenauigkeit) etwa
1, 5 Minuten, wogegen das Mehrgitterverfahren nur“ 1 Sekunde benötigt.
”
68
2.4 Übungen
Übung 2.1: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem
Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (sog. “Mehrstellenformel”)
(9)
−∆h uh (x, y) = f (x, y),
(x, y) ∈ Ωh ,
mit dem “gestreckten” Differenzenoperator
(9)
∆h u(x, y) :=
o
1 n
−
u(x
±
2h,
y)
+
16u(x
±
h,
y)
−
u(x,
y
±
2h)
+
16u(x,
y
±
h)
−
60u(x,
y)
12h2
und dem 9-Punkte-Differenzenschema
(9)
−∆h uh (x, y) = f (x, y) +
1 2
12 h ∆f (x, y),
(x, y) ∈ Ωh
mit dem “kompakten” Differenzenoperator
n
o
¯ (9) u(x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) .
∆
h
6h2
Man zeige, daß dies Approximationen mit der Konsistenzordnung m = 4 sind.
Übung 2.2: In vielen Fällen kann die asymptotische Konvergenzordnung eines Differenzenverfahrens nur experimentell bestimmt werden. Dazu werden bei bekannter exakter Lösung für zwei
Schrittweiten h und h/2 die Fehler eh := u − uh und eh/2 := u − uh/2 berechnet und dann die
Ordnung α über den formalen Ansatz ku − uh kh = hα mit einer geeigneten Gitternorm k · kh
aus der folgenden Formel ermittelt:
α=
log(keh kh /keh/2 kh )
.
log(2)
a) Man rechtfertige diese Formel und überlege, wie man vorgehen kann, wenn keine exakte
Lösung u bekannt ist.
b) Man bestimme die inhärente Konvergenzordnungen der folgenden Zahlenfolgen:
h = 2−1
33.627
26.570
−2
h=2
30.318
27.008
h = 2−3
29.100
27.883
−4
h=2
28.586
28.072
h = 2−5
28.351
28.117
Übung 2.3: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem
Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema
(9)
∆h uh (x, y) = fh (x, y) := f (x, y) +
1 2
12 h ∆f (x, y),
(x, y) ∈ Ωh ,
2.4 Übungen
69
mit dem “kompakten” Differenzenoperator
(9)
∆h u(x, y) =
o
1 n
4u(x
±
h,
y)
+
4u(x,
y
±
h)
+
u(x
±
h,
y
±
h)
−
20u(x,
y)
.
6h2
Diese Approximationen hat nach Aufgabe 3.3 die Konsistenzordnung m = 4 .
a) Man zeige mit den Mitteln der Vorlesung die Fehlerabschätzung
max |u(P ) − uh (P )| ≤ cM6 (u)h4 .
P ∈Ωh
b) (Zusatzaufgabe für Leute mit Ergeiz und Zeit) Im Falle eines allgemeinen, glattberandeten Gebiets Ω ⊂ R2 werde entlang der gekrümmten Randabschnitte die Shortley-WellerApproximation betrachtet:
(9)
−∆h uh = f +
1 2
12 h ∆f
in Ωh ,
−∆∗h uh = f in Ω∗h ,
uh = g auf ∂Ωh .
Man zeige hierfür mit den Mitteln der Vorlesung die Fehlerabschätzung
max |u(P ) − uh (P )| ≤ c {M6 (u)h4 + M3 (u)h3 }.
P ∈Ωh
Übung 2.4: Sei Ah die zum 5-Punkte-Operator auf dem Einheitsquadrat gehörende N × N Matrix (bei zeilenweiser Nummerierung der Gitterpunkte mit m Punkten in jeder Zeile). Die
N = m2 Eigenvektoren wνµ , ν, µ = 1, . . . , m , und die zugehörigen Eigenwerte λνµ von Ah
sind gegeben durch:
wνµ (x, y) = sin(νπx) sin(µπy), (x, y) ∈ Ωh ,
λνµ =
1
4
−
2(cos(νhπ)
+
cos(µhπ)
.
h2
Man zeige, daß für die Spektralkondition von Ah gilt:
cond2 (Ah ) =:
4
λmax (Ah )
= 2 2 + O(1).
λmin (Ah )
π h
Übung 2.5: Eine Matrix A ∈ RN ×N heißt “M-Matrix”, wenn sie von nichtnegativem Typ und
(−1)
(−1)
regulär ist und wenn ihre Inverse A−1 = (aij )N
≥ 0.
i,j=1 elementweise nichtnegativ ist: aij
Das 5-Punkte-Differenzenschema (bzw. das Shortley-Weller-Schema) zur Approximation der 1.
RWA des Laplace-Operators führt z.B. auf eine solche M-Matrix.
a) Man zeige, daß M-Matrizen “invers-monoton” sind, d.h.: Für Vektoren v, w ∈ RN gilt komponentenweise:
Av ≥ Aw ⇒ v ≥ w.
b) Ist ferner Ah w ≥ (1, . . . , 1)T für einen Vektor w ∈ RN , so folgt bzgl. der Maximumnorm
bzw. Maximalen-Zeilensummen-Norm:
kA−1
h k∞ ≤ kwk∞ .
c) Man zeige mit Hilfe von (b), daß für die Systemmatrix Ah des 5-Punkte-Schemas auf dem
70
Einheitsquadrat die Abschätzung
kA−1
h k∞ ≤ 1/8
gilt, und folgere hiermit für die l∞ -Kondition von Ah :
−2
cond∞ (Ah ) := kAh k∞ kA−1
h k∞ ≤ h .
Die l∞ -Kondition von Ah verhält sich also in Abhängigkeit von der Gitterweite h genauso wie
die Spektralkondition. (Hinweis: Man versuche es mit der mit w(x, y) = x(1 − x)/2 + y(1 − y)/2
gebildeten Gitterfunktion.)
Übung 2.6: Gegeben sei die 1. RWA des Laplace-Operators
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Dreiecksgebiet Ω = {(x, y) ∈ R2 | x, y > 0, x + y < 1} . Man stelle zu einem äquidistanten, kartesischen Gitter das Gleichungssystem der 5-Punkte-Differenzenapproximation auf und
vergleiche (a) die zeilenweise, (b) die diagonale und (c) die schachbrettartige Gitterpunktnumerierung in Bezug auf Matrixstruktur, Speicherplatzbedarf und Rechenaufwand bei der Lösung
mit dem LR-Verfahren unter Ausnutzung der Bandstruktur.
Übung 2.7: Zur Auffrischung der Kenntnise über iterative Lösungsverfahren: Eine Vereinfachung des Jacobi-Verfahrens zur Lösung eines linearen N ×N -Gleichungssystems Ax = b ist das
sog. “Richardson-Verfahren”. Dabei wird ausgehend von einem beliebigen Startvektor x0 ∈ RN
mit einem Dämpfungsparameter θ ∈ R wie folgt iteriert:
xt+1 = xt − θ(Axt − b),
t = 0, 1, 2, . . . .
a) Im Falle, daß A nur reelle Eigenwerte λmin ≤ · · · ≤ λ ≤ · · · ≤ λmax besitzt, zeige man für
den Spektralradius ρ(Bθ ) der zugehörigen Iterationsmatrix Bθ = I − θA die Gleichung
ρ(Bθ ) = max |1 − θλmin |, |1 − θλmax | .
b) Im Falle, daß zusätzlich alle Eigenwerte positiv sind, zeige man
ρ(Bθ ) < 1
⇔
0<θ<
2
λmax
.
c) Für welchen Wert von θ wird ρ(Bθ ) in dieem Falle minimal?
Übung 2.8: Betrachtet werde wieder das Modellproblem
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Einheitsquadrat Ω ⊂ R2 . Die Systemmatrix des 5-Punkte-Diffrenzenoperators auf einem äquidistanten, kartesischen Punktgitter läßt sich schreiben als Summe der Anteile der beiden
Differenzenquotienten in x- und y-Richtung: A = Ax + Ay . Bei lexikographischer Numerierung
sind dabei Ax und Ay reguläre Tridiagonalmatrizen mit den Einträgen 2h−2 auf den Hauptdiagonalen und −h−2 verteilt auf den Nebendiagonalen. Das zugehörige Gleichungssystems
2.4 Übungen
71
AU = F besitzt damit die äquivalenten Formen
(σI + Ax )U = (σI − Ay )U + F,
(σI + Ay )U = (σI − Ax )U + F
mit einem beliebigen Parmeterwert σ > 0. Dies legt das folgende zweistufige Iterationsverfahren
(sog. “ADI-Verfahren” = “Alternating Direction Implicit Iteration”) nahe:
(σI + Ax )U t+1/2 = (σI − Ay )U t + F,
(σI + Ay )U t+1 = (σI − Ax )U t+1/2 + F.
Man zeige die Konvergenz dieses Verfahrens. Für welche Wahl von σ wird die Konvergenz am
schnellsten? (Hinweis: Man überlege sich, daß die Zerlegungsmatrizen Ax und Ay ein gemeinsames System von Eigenvektoren besitzen und folglich vertauschbar sind.)
72
3 Finite-Elemente-Verfahren für elliptische Probleme
In diesem Kapitel werden wir die modernen Finite-Elemente-(Galerkin)-Methoden zur Lösung
elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber werden wir uns dabei
auf das Modellproblem der Poisson-Gleichung mit Dirichletschen Randbedingungen, d.h. auf die
1. RWA, beschränken:
Lu := −∆u = f
in Ω,
u = g auf ∂Ω.
(3.0.1)
Das Definitionsgebiet Ω ∈ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen
Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen
Koeffizienten oder anderen Randbedingungen sowie auf drei Raumdimensionen werden wieder
in Bemerkungen berücksichtigt.
3.1 Allgemeine Projektionsverfahren
Ausgangspunkt ist die variationelle Formulierung der Randwertaufgabe. Wir erinnern an den
oben diskutierten Ansatz zu einer allgemeinen Lösungstheorie. Eine schwache bzw. verallgemeinerte Lösung der 1. RWA des Laplace-Operators (zu den Randdaten g ≡ 0 ) ist definiert als das
(eindeutige) Minimum auf dem Sobolew-Raum H01 (Ω) des Energiefunktionals
E(v) := 21 k∇vk2 − (f, v) → min.
Wir verwenden hier und im folgenden wieder die Bezeichnungen
Z
1/2
1/2
Z
Z
2
|v(x)| dx
|∇v(x)|2 dx
v(x)w(x) dx, kvk :=
, k∇vk :=
.
(v, w) :=
Ω
Ω
Ω
Über den Variationsansatz
d
E(u + εϕ)|ε=0 = 0
dε
∀ϕ ∈ H01 (Ω)
erhalten wir die äquivalente Variationsgleichung (Stationäritätsbedingung)
u ∈ H01 (Ω) :
(∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ H01 (Ω).
(3.1.2)
Wir erinnern daran, daß das natürliche Skalarprodukt des Raumes H01 (Ω) gerade durch (∇v, ∇w)
gegeben ist. Zum Nachweis der Definitheit dieses Ausdrucks haben wir die Poincarésche Ungleichung verwendet:
kvk ≤ dΩ k∇vk,
v ∈ H01 (Ω).
(3.1.3)
Bemerkung 3.1: Im Falle inhomogener Randbedingungen u|∂Ω = g geht man wie folgt vor.
Wir nehmen an, daß die Randwerte als Spur einer Funktion ḡ ∈ H 1 (Ω) gegeben sind: g = ḡ|∂Ω .
Für die Funktion v := u − ḡ ∈ H01 (Ω) gilt dann im Falle ∆ḡ ∈ L2 (Ω) :
(∇v, ∇ϕ) = (f, ϕ) − (∆ḡ, ϕ) =: (f˜, ϕ)
73
∀ϕ ∈ H01 (Ω),
74
Finite-Elemente-Verfahren für elliptische Probleme
d.h.: Die Funktion v genügt einer Variationsgleichung der Art (3.1.2). Im folgenden können wir
also o.B.d.A. stets homogene Dirichlet-Randbedingungen annehmen.
Bemerkung 3.2: Im Fall von Neumannschen Randbedingungen ∂n u|∂Ω = g wird der SobolewRaum H 1 (Ω) (ohne Vorgabe von Randwerten) verwendet und die zugehörige variationelle Formulierung lautet
u ∈ H 1 (Ω) :
(∇u, ∇ϕ) = (f, ϕ) + (g, ϕ)∂Ω
∀ϕ ∈ H 1 (Ω).
(3.1.4)
Um die eindeutige Lösbarkeit zu sichern, muß in diesem Fall noch eine Zusatzbedingung gestellt
werden, um konstante Lösungen auszuschließen, z.B.: die Normierungsbedingung (u, 1)Ω = 0 .
Ferner muß die Verträglichkeitsbedingung (f, 1)+(g, 1)∂Ω = 0 erfüllt sein. Jede hinreichend glatte Lösung von (3.1.4) erfüllt dann neben der Differentialgleichung −∆u = f auch notwendig die
in der variationellen Formulierung implizit enthaltene natürliche Randbedingung ∂n u|∂Ω = g
(Beweis ähnlich wie im Fall der 1. RWA durch partielle Integration und Variation der Testfunktion). Eine ähnliche Konstruktion liefert auch die variationelle Formulierung im Fall der 3. RWA,
d.h. für Robinsche Randbedingungen.
Bemerkung 3.3: Nicht alle elliptischen Randwertaufgaben lassen sich über den Energieminimierungsansatz behandeln. Ein typisches Beispiel ist die Diffusions-Transport-Gleichung
−∆u + ∂1 u = f
in Ω,
u = g auf ∂Ω.
(3.1.5)
Ihre variationelle Formulierung lautet
(∇u, ∇ϕ) + (∂1 u, ϕ) = (f, ϕ)
∀ϕ ∈ H01 (Ω).
(3.1.6)
Diese besitzt ebenfalls eine eindeutige Lösung u ∈ H01 (Ω) , was sich weiter unten als Folgerung
eines allgemeineren Resultats ergeben wird.
Die folgende Diskussion wird in einem etwas abstrakteren Rahmen durchgeführt, welche an
den obigen Beispielen orientiert ist und diese als Sonderfälle beinhaltet. Seien V ein Hilbert1/2
Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV := (·, ·)V und a(·, ·) : V ×V → R
eine beschränkte Bilinearform sowie l(·) : V → R eine beschränkte Linearform:
|a(v, w)| ≤ αkvkV kwkV ,
|l(v)| ≤ γkvkV ,
v, w ∈ V.
(3.1.7)
Mit diesen Bezeichnungen betrachten wir die folgende allgemeine Variationsgleichung: Bestimme
u ∈ V , so daß
a(u, ϕ) = l(ϕ)
∀ϕ ∈ V.
(3.1.8)
Zum Nachweis, daß diese Aufgabe auch eine Lösung besitzt, postulieren wir, daß die Bilinearform
a(·, ·) (stark) V -elliptisch“ ist, d.h.:
”
a(v, v) ≥ κkvk2V ,
v ∈ V,
(3.1.9)
mit einer Konstante κ > 0 . Allgemeiner wird die Bilinearform a(·, ·) koerzitiv“ (oder regulär“)
”
”
genannt, wenn
sup
ϕ∈V
75
a(v, ϕ)
≥ γ kvkV ,
kϕkV
sup
ϕ∈V
a(ϕ, v)
≥ γ kvkV ,
kϕkV
v ∈ V,
(3.1.10)
mit einer Konstante γ > 0 .
Hilfssatz 3.1: (Lax1 -Milgram2 -Lemma) Unter den obigen Voraussetzungen besitzt die Gleichung (3.1.8) eine eindeutige Lösung u ∈ V , für welche die a priori Abschätzung gilt:
kukV ≤
α
klkV ∗ ,
κ
(3.1.11)
mit der Dualnorm“ klkV ∗ := sup{ϕ∈V, kϕk=1} |l(ϕ)| .
”
Beweis: Für jedes feste v ∈ V definiert a(v, ·) ein lineares, stetiges Funktional auf V . Nach
dem Rieszschen3 Darstellungssatz existieren Elemente Av ∈ V und f ∈ V , so daß
a(v, ϕ) = (Av, ϕ)V ,
l(ϕ) = (f, ϕ)V ,
ϕ ∈ V.
Die Zuordnung v 7→ Av definiert eine lineare Abbildung mit der Eigenschaft
kAvkV ∗ ≤ αkvkV ,
d.h.: A ist beschränkt. Die Aufgabe (3.1.8) ist offenbar äquivalent zu der Gleichung
Au = f .
(3.1.12)
Wir wollen zeigen, daß die Abbildung
v ∈ V 7→ Tδ v := v − δ(Av−f ) ∈ V
für einen geeigneten Wert δ > 0 eine Kontraktion auf ganz V ist. Dann besitzt die Fixpunktgleichung
Tδ v = v
eine eindeutige Lösung u ∈ V , welche wegen 0 = v − Tδ v = δ(Av − f ) dann auch (eindeutige)
Lösung von (3.1.12) bzw. (3.1.8) ist. Die Kontraktionseigenschaft ergibt sich aus der Beziehung
kv − δAvk2V = kvk2V − 2δ a(v, v) + δ2 kAvk2V
≤ (1 − 2δκ + δ2 α2 )kvk2V ,
für 0 < δ < 2κ/α2 .
Q.E.D.
1
Peter D. Lax (1926-): US-amerikanischer Mathematiker ungarischer Abstammung; Prof. an der New York
University und am Courant-Institut; wichtige Beiträge zur Analysis, insbesondere zu den partiellen Differentialgleichungen der Math. Physik, und zur Numerik.
2
A. N. Milgram (????-????): US-amerikanischer Mathematiker; Topologe.
3
Frigyes Riesz (1880-1956): ungarischer Mathematiker; Prof. in Szeged und Budapest; fundamentale Beiträge
zur Funktionalanalysis, insbesondere der Fourier-Analysis im Hilbert-Raum als theoretische Grundlage der frühen
Quantenmechanik.
76
Die beiden obigen Beispiele zur 1. RWA passen in diesen Rahmen mit den Setzungen V :=
H01 (Ω) , l(v) := (f, ϕ) und
a(v, w) := (∇v, ∇w),
a(v, w) := (∇v, ∇w) + (∂1 v, w).
Die Beschränktheit dieser Formen ergibt sich direkt mit Hilfe der Hölderschen und der Poincaréschen Ungleichung. Ihre V -Elliptizität ergibt sich unmittelbar:
a(v, v) = k∇vk2 = kvk2V ,
bzw. unter Beachtung von v|∂Ω = 0 :
a(v, v) = k∇vk2 + (∂1 v, v) = k∇vk2 + 12 (∂1 v 2 , 1)
= k∇vk2 + 12 (n1 v 2 , 1)∂Ω = k∇vk2 = kvk2V .
Durch geeignete Setzungen lassen sich auch die variationellen Formulierungen der 2. und 3. RWA
in diesen abstrakten Rahmen einordnen.
Zur Approximation der Variationsgleichung (3.1.2) werden endlich dimensionale Teilräume
Vh ⊂ V
(0 < h ≤ h0 )
ausgewählt, deren Feinheit durch einen Diskretisierungsparameter h (z.B.: Gitterweite) charakterisiert ist.
(i) Im Fall einer symmetrischen Bilinearform a(·, ·) bestimmt das klassische Ritzsche4 Projek”
tions-Verfahren“ Näherungslösungen uh ∈ Vh durch die Vorschrift
E(uh ) = min E(vh )
vh ∈V
(3.1.13)
oder äquivalent durch die diskrete Variationsgleichung
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.14)
Die (eindeutige) Existenz der diskreten Lösung uh ∈ Vh folgt mit demselben Argument wie
beim kontinuierlichen Problem. Diese Analogie der Schlußweisen von kontinuierlicher und diskreter (endlich dimensionaler) Situation ist die charakteristische Stärke der Projektionsmethoden
im Gegensatz zu den Differenzenverfahren. Die Bezeichnung Projektionsverfahren ist motiviert
durch die Beziehung
a(u − uh , ϕh ) = 0 ϕh ∈ Vh ,
(3.1.15)
welche man durch Subtraktion der Gleichungen (3.1.2) und (3.1.14) erhält. Sie kann geometrisch dahingehend interpretiert werden, daß der Fehler eh := u − uh bzgl. des Skalarprodukts
a(·, ·) senkrecht auf dem Ansatzraum Vh steht. Dies impliziert auch die sog. Bestapproxi”
mationseigenschaft“ für den Approximationsfehler eh bzgl. der natürlichen Energie-Norm“
”
4
Walter Ritz (1878-1909): schweizer Physiker; Prof. in Zürich und Göttingen; Beiträge zu Spektraltheorie in
der Kernphysik und Elektro-Magnetismus.
77
k · ka := a(·, ·)1/2 , denn mit beliebigem ϕh ∈ Vh gilt:
keh k2a = a(eh , eh ) = a(eh , u − ϕh ) + a(eh , ϕh − uh ) ≤ keh ka ku − ϕh ka
bzw.
keh ka ≤ inf ku − ϕh ka .
ϕh ∈Vh
(3.1.16)
Da die Normen k · ka und k · kV auf V äquivalent sind, ist die Frage nach der Konvergenz des
Projektionsverfahrens,
keh kV → 0
(h → 0),
(3.1.17)
damit zurückgeführt auf die Frage der Approximierbarkeit von Funktionen u ∈ V durch Ansatzfunktionen ϕh ∈ Vh :
inf ku − ϕh kV → 0 (h → 0).
ϕh ∈Vh
(3.1.18)
(ii) Wenn die Bilinearform a(·, ·) nicht symmetrisch ist, wie beim obigen Diffusions-TransportProblem, kann die zugehörige RWA nicht mehr durch ein Minimierungsproblem charakterisiert
werden. Das allgemeine Galerkinsche5 (Projektions)-Verfahren“ geht direkt von der Variations”
gleichung (3.1.2) aus und bestimmt Näherungen durch die Beziehung
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.19)
Wegen der V -Elliptizität der Bilinearform a(·, ·) auf dem endlich dimensionalen Teilraum Vh
folgt unmittelbar die Existenz der (eindeutigen) Lösung uh ∈ Vh . Die Orthogonalitätsbeziehung
(3.1.15) bleibt dabei gültig. Damit erschließen wir die Quasi-Best-Approximationseigenschaft
(Übungsaufgabe)
keh kV ≤
α
min ku − ϕh kV .
κ ϕ∈Vh
(3.1.20)
(iii) Eine noch allgemeinere Variante, bei der Ansatzraum Vhansatz und Testraum Vhtest unterschiedlich gewählt werden,
u ∈ Vhansatz :
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vhtest ,
(3.1.21)
ist das sog. Petrow6 -Galerkin-Verfahren“. Wir werden später Beispiele für diesen unkonven”
tionellen Ansatz kennenlernen.
Zur praktischen Realisierung des Projektionsverfahrens muß die zunächst abstrakte Variationsgleichung (3.1.19) im Funktionenraum algebraisiert werden, d.h.: in ein äquivalentes
algebraisches Gleichungssystem umgewandelt werden. Dazu wählen wir zunächst eine Basis
5
Boris Grigorievich Galerkin (1871-1945): russischer Bauingenieur und Mathematiker; Prof. in St. Petersburg;
Beiträge zur Struktur-Mechanik, insbesondere zur Plattentheorie.
6
Georgi Iwanowitsch Petrow (1912-1987): russischer Ingenieur; 1965-1973 Direktor des Instituts für Raumfahrtforschung; Publ.: “Application of the Galerkin method and the problem of flow stability of a viscous liquid”
(russ.), Prikl. Mat. Mekh. 4, 36-47 (1947)
78
(i)
{ϕh , i = 1, ..., N }, N := dim Vh , von Vh aus und machen für die zu bestimmende diskrete
P
(j)
Lösung den Ansatz uh = N
j=1 ξj ϕh . Wird dies in (3.1.19) eingesetzt und läßt man die Testfunktionen ϕh ∈ Vh alle Basisfunktionen durchlaufen, ergibt sich ein lineares (algebraisches)
N × N -Gleichungssystem
N
X
(j)
(i)
(i)
ξj a(ϕh , ϕh ) = (f, ϕh ),
i = 1, ..., N,
j=1
für den Vektor ξ = (ξj )N
j=1 der Entwicklungskoeffizienten, bzw. in kompakter Schreibweise
Ah ξ = bh .
(3.1.22)
N
Dabei sind die Koeffizientenmatrix Ah = (aij )N
i,j=1 sowie die rechte Seite bh = (bi )i=1 durch
die spezielle Wahl der Basis bestimmt:
(j)
(i)
(j)
bj = (f, ϕh ).
aij = a(ϕh , ϕh ),
Die Entwicklungskoeffizienten ξj können sehr unterschiedliche Bedeutung haben; z.B.: MonomKoeffizienten einer Polynomdarstellung, Fourier-Koeffizienten einer trigonometrischen Entwicklung, Knotenwerte einer stückweise polynomialen Funktion, u.s.w.. Die Eigenschaften der Bilinearform a(·, ·) übertragen sich direkt auf die zugehörige Matrix Ah . Ist a(·, ·) symmetrisch,
so auch Ah ,
(j)
(i)
(i)
(j)
aij = a(ϕh , ϕh ) = a(ϕh , ϕh ) = aji ,
und die V -Elliptizität von a(·, ·) impliziert die Definitheit von Ah , denn für x ∈ Rn \ {0} gilt:
(Ah x, x) =
N
X
aij xi xj =
i,j=1
N
X
(j)
(i)
a(ϕh , ϕh )xi xj
i,j=1
N
N
N
X
X
X
(i) 2
(i)
(j)
xi ϕh > 0.
xi ϕh ≥ κ
=a
xj ϕh ,
j=1
i=1
i=1
V
3.1.1 Beispiele von Galerkin-Ansatzräumen
Wir wollen einige konkrete Realisierungen für den beschriebenen abstrakten Rahmen diskutieren. Bei der Wahl der Ansatzräume Vh ⊂ V = H01 (Ω) sowie der Basen zur Aufstellung der
Gleichungssysteme (3.1.22) sind einige Bedingungen zu beachten:
(j)
(i)
(i)
– Die Berechnung der Matrixelemente aij = a(ϕh , ϕh ) sowie die der rechten Seite (f, ϕh )
sollte billig“ sein.
”
– Aus Genauigkeitsgründen wird die Problemdimension in der Regel sehr groß sein: N ≫
100 . Die Matrix Ah sollte daher möglichst dünn besetzt sein.
– Die Matrix Ah sollte nicht zu schlecht konditioniert sein; akzeptabel sind z.B. beim vorliegenden Problem cond2 (Ah ) ≈ O(N ) − O(N 2 ) , wogegen cond2 (Ah ) ≈ O(N 4 ) − O(eN )
nicht praktikabel wären.
Beispiele von solchen Ansätzen sind:
79
1) Globaler Polynomansatz: Auf einem Quadrat Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz
gemacht
m
X
cij xi y j , h := 1/m, N = (m + 1)2 .
Vh := Qm (Ω) := p(x, y) =
i,j=0
Als Basen kommen dabei in Frage:
a) Monombasis 1, x, y, x2 , xy, y 2 , ... ; die zugehörige Matrix A mit den Elementen
aij =
Z
0
1Z 1
0
∇xi · ∇y j dx dy,
0 ≤ i, j ≤ m,
verhält sich dann wie die bekannte Hilbert-Matrix mit exponentiell mit N wachsender Kondition
cond2 (Ah ) = O(eN ) . Dieser Ansatz ist also praktisch unbrauchbar.
b) Tensorprodukt-Basen L2 -orthogonaler Polynome wie z.B. Legendre-Polynome oder Tschebyscheff-Polynome; die zugehörige Matrix Ah mit den Elementen
Z 1Z 1
(m)
(m)
∇Li · ∇Lj dx dy, 0 ≤ i, j ≤ m,
aij =
0
0
ist dann zwar voll besetzt, hat aber eine wesentlich günstigere Kondition, cond2 (Ah ) = O(N ) .
Dieser Ansatz führt auf die sog. Spektral-Galerkin-Verfahren“, welche bei Problemen auf geo”
metrisch einfachen (rechteckigen) Gebieten sehr leistungsfähig sind. Die Bezeichnung Spek”
tralverfahren“ rührt daher, daß man die orthogonalen Polynome auch als Eigenfunktionen gewisser Differentialoperatoren 2. Ordnung charakterisieren kann. Wegen ihrer konzeptionellen
Beschränkung auf einfache Geometrien wollen wir derartige Methoden hier nicht weiter diskutieren. Stichworte für Entwicklungen in Richtung auf eine Überwindung dieser Restriktion sind
z.B. Spektral-Elemente-Methoden“ und h/p-Finite-Elemente-Methode“.
”
”
2) Globaler trigonometrischer Ansatz ( echte Spektralverfahren“): Wieder auf einem Quadrat
”
Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht
m
X
cij sin(iπx) sin(jπy) ,
Vh := Tm (Ω) := t(x, y) =
h := 1/m, N = (m + 1)2 .
i,j=0
Als Basen verwendet man dabei die natürliche trigonometrische Basis
{1, sin(nπx) sin(mπy), ...} .
Die zugehörige Matrix Ah ist dann vergleichsweise gut konditioniert, cond2 (Ah ) = O(N ) .
In diesem Fall gibt es mit der schnellen Fourier-Transformation ( FFT“) einen fast optimalen
”
Algorithmus mit der Komplexität O(N ln(N )) zur Lösung des Gleichungssystems (3.1.22). Der
Nachteil dieses in Spezielfällen sehr leistungsfähigen Ansatzes ist wieder seine Beschränktheit
auf einfache Rechteckgeometrien und sog. separable“ Differentialoperatoren mit konstanten
”
Koeffizienten.
3) Stückweise polynomialer Ansatz ( Finite Elemente“): Um das Problem der Approximation
”
allgemeiner Gebiete zu lösen, werden Ansatzfunktionen (auch Formfunktionen“ genannt) ver”
wendet, welche bzgl. einer Zerlegung von Ω in einfache Teilgebiete T , sog. Zellen“, stückweise
”
polynomial sind. Gängige Beispiele von Zellen sind Dreiecke oder (konvexe) Vierecke in zwei
bzw. Tetraeder oder (konvexe) Hexaeder in drei Dimensionen. Der Parameter h ist in diesem
80
Fall etwa der maximale Zelldurchmesser.
Wir illustrieren diesen Finite-Elemente-Ansatz anhand eines einfachen Beispiels. Die 1. RWA
(3.1.2) sei auf einem (konvexen) polygonalen Gebiet Ω ⊂ R2 mit homogenen Randwerten u|∂Ω =
0 und rechter Seite f ∈ L2 (Ω) gestellt. Die zugehörige Lösung u ∈ H01 (Ω) ist dann auch im
Sobolew-Raum H 2 (Ω) und genügt der a priori Abschätzung
k∇2 uk ≤ cs kf k,
(3.1.23)
wobei cs = 1 im Falle eines konvexen Gebiets.
Weiter sei eine Folge von Zerlegungen Th = {T } des Gebiets Ω in abgeschlossene Dreiecke T ( Triangulierung“) gegeben mit h := maxT diam(T ) → 0 . Wir stellen die folgenden
”
Regularitätsbedingungen an diese Triangulierung:
S
i) Strukturregularität: Je zwei Dreiecke der Zerlegung Ω = {T ∈ Th } überlappen sich
höchstens in gemeinsamen Eckpunkten oder in ganzen Seiten, d.h.: Sog. hängende“ Knoten
”
sind hier nicht erlaubt.
ii) Formregularität: Alle Dreicke der Triangulierungen T ∈ Th sind von ähnlicher Gestalt, d.h.:
Für den Inkreisradius ρT und Umkreisradius hT eines jeden Dreiecks T gilt gleichmäßig für
h → 0:
max
T ∈Th
hT
≤ c1
ρT
(3.1.24)
iii) Größenregularität: Alle Dreiecke einer Triangulierung Th sind von gleicher Größenordnung,
d.h.: Es gilt gleichmäßig für h → 0 :
max hT ≤ c2 min hT .
T ∈Th
T ∈Th
(3.1.25)
T
Ω
Abbildung 3.1: Finite-Elemente: Dreiecks- bzw. Vierecksgitter
Auf den Triangulierungen Th definieren wir Ansatzräume stückweise linearer Funktionen
( lineare finite Elemente“: Verallgemeinerung des Konzepts eines Polygonzugs auf höhere Raum”
dimensionen):
(1)
Vh := {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , v|∂Ω = 0} .
Dabei bezeichnet allgemein Pr (T ) den Vektorraum der Polynome bis zum Grad r ≥ 0 über
(1)
T . Man überlegt sich leicht, daß dadurch tatsächlich Teilräume Vh ⊂ H01 (Ω) erklärt sind. Sei
81
(1)
N die Anzahl der inneren“ Knoten (Dreieckseckpunkte) der Triangulierung. Jedes vh ∈ Vh
”
ist als stückweise lineare Funktion eindeutig durch Vorgabe ihrer Funktionswerte ( Knotenwer”
te“) in den inneren“ Dreieckseckpunkten ( Knoten“) festgelegt. In den Eckpunkten auf dem
”
”
(1)
Gebietsrand ∂Ω ist vh = 0 wegen der Dirichlet-Randbedingung. In Vh gibt es daher eine
natürliche Basis, die sog. Knotenbasis“ in Analogie zur Lagrange7 -Basis“ bei der eindimen”
”
sionalen Lagrange-Interpolation. Jedem Knoten ai wird durch die Bedingung
ϕih (aj ) = δij ,
(1)
eindeutig eine Funktion ϕih ∈ Vh
stellung
j = 1, ..., N,
(1)
zugeordnet. Damit gilt dann für jedes vh ∈ Vh
vh =
N
X
die Dar-
(i)
vh (ai )ϕh .
i=1
(i)
{ϕh ,
(1)
i = 1, ..., N } tatsächlich eine Basis von Vh
Daraus folgt, daß
jeder kontinuierlichen Funktion v ∈ C(Ω) durch die Vorschrift
Ih v :=
N
X
ist. Umgekehrt läßt sich
(i)
v(ai )ϕh
i=1
(1)
eindeutig eine (stückweise lineare) Interpolierende“ Ih v ∈ Vh
”
(1)
vh für vh ∈ Vh .
zuordnen. Offenbar ist Ih vh ≡
Dieser Diskretisierungsansatz erfüllt offensichtlich die oben formulierten Anforderungen an
ein brauchbares Galerkin-Verfahren: Die resultierende Systemmatrix Ah ist dünn besetzt (wegen
der geringen Überlappung der Träger der Basisfunktionen), und ihre Elemente sind sehr leicht zu
berechnen. Wir werden die praktische Berechnung von A im Zusammenhang mit allgemeineren
Finite-Elemente-Ansätze dieser Art noch eingehender diskutieren.
Abbildung 3.2: Knotenbasisfunktionen: Lineare und bilineare Ansätze
Für die Kondition der Matrix Ah werden wir später in zwei Dimensionen cond2 (Ah ) =
O(h−2 ) = O(N ) zeigen (ähnlich wie bei der 5-Punkte-Differenzendiskretisierung). Wir reka7
Joseph Louis de Lagrange (1736-1813): französischer Mathematiker; 1766-87 Direktor der mathem. Klasse
der Berliner Akademie, dann Prof. in Paris; bahnbrechende Arbeiten zur Variationsrechnung, zur komplexen
Funktionentheorie sowie zur theor. Mechanik und Himmelsmechanik.
82
(1)
pitulieren für das Galerkin-Verfahren mit dem Finite-Elemente-Raum Vh
Abschätzung für den Fehler eh := u − uh :
k∇eh k = min
(1)
ϕh ∈Vh
k∇(u − ϕh )k.
die asymptotische
(3.1.26)
(1)
Die Frage ist also, ob es ϕh ∈ Vh gibt, so daß k∇(u − ϕh )k → 0 (h → 0) . Wenn man nur weiß,
daß u ∈ H01 (Ω) ist, dann kann man nur qualitative Konvergenz zeigen. Viel interessanter wäre
es, wieder die Konvergenzgeschwindigkeit in Potenzen der Gitterweite h zu kennen. Hierzu ist
aber natürlich mehr Regularität der Lösung u erforderlich. Für den stückweise linearen Ansatz
werden wir später im Rahmen einer allgemeinen Theorie die folgende Interpolationsabschätzung
zeigen:
k∇(v − Ih v)k ≤ ci h k∇2 vk,
v ∈ H01 (Ω) ∩ H 2 (Ω).
(3.1.27)
(Man vergleiche die analoge Abschätzung, welche in einer Dimension bei der Finite-ElementeApproximation eindimensionaler Sturm-Liouville-Probleme verwendet wird.) Unter den bisher
formulierten Voraussetzungen läßt sich eine erste quantitative Konvergenzaussage für das FiniteElemente-Verfahren ableiten.
Satz 3.1 (Konvergenzsatz): Für die Galerkin-Approximation des Modellproblems (3.1.2) mit
linearen“ finiten Elementen gelten unter den obigen Voraussetzungen die Fehlerabschätzungen
”
k∇eh k ≤ ci cs h kf k,
keh k ≤
c2i c2s h2 kf k,
(3.1.28)
(3.1.29)
mit den Konstanten ci , cs aus den Ungleichungen (3.1.27) und (3.1.23).
Beweis: (i) Die Abschätzung des sog. Energienorm-Fehlers“ ergibt sich unmittelbar aus der
”
Best-Approximationsbeziehung (3.1.26), der Interpolationsabschätzung (3.1.27) und der Regularitätsabschätzung (3.1.23):
k∇eh k ≤ k∇(u − Ih u)k ≤ ci h k∇2 uk ≤ ci cs h kf k.
(ii) Zum Beweis der Fehlerabschätzung in der L2 -Norm verwenden wir ein sog. Dualitätsargu”
ment“ ( Aubin8 -Nitsche9 -Trick“). Sei z ∈ H01 (Ω) die (schwache) Lösung des Hilfsproblems
”
−∆z = keh k−1 eh in Ω,
z|∂Ω = 0.
Diese ist dann auch in H 2 (Ω) , und es gilt die a priori Abschätzung
k∇2 zk ≤ cs k∆zk = cs ,
8
Jean-Pierre Aubin (1939-): französischer Mathematiker; Prof. an der Univ. Paris-Dauphine (2004) emeritiert);
Beiträge zur Theorie partieller Differentialgleichungen und ihrer Numerik.
9
Joachim A. Nitsche (1926-1996): deutscher Mathematiker; Prof. in Freiburg; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode.
83
wobei wieder cs = 1 auf konvexem Gebiet Ω . Nach Konstruktion folgt mit Hilfe der GalerkinOrthogonalität:
keh k = (∇eh , ∇z) = (∇eh , ∇(z − Ih z))
≤ k∇eh k k∇(z − Ih z)k ≤ ci h k∇eh k k∇2 zk ≤ ci cs h k∇eh k.
Mit dem Ergebnis (i) ergibt sich damit die gewünschte Abschätzung.
Q.E.D.
Die im Beweis von Satz 3.1 verwendete Schlußweise über ein Dualitätsargument ist das“
”
zentrale Hilfsmittel bei der Konvergenzanalyse von Finite-Elemente-Verfahren. Dieses abstrakte
Argument entspricht der allgemeinen Regel, daß sich die Analyse der Projektionsverfahren eng
an die abstrakten Hilbertraum-Methoden zur Behandlung des kontinuierlichen Problems anlehnt. Das zentrale Hilfmittel bei der Untersuchung von Differenzenverfahren war dagegen das
(diskrete) Maximumprinzip“, welches sich mehr an den klassischen Techniken für partielle Dif”
ferentialgleichungen orientiert. Wir wollen diesen Vergleich Finite-Elemente-Method (FEM) ”
Finite-Differenzen-Method (FDM)“ anhand des Resultats von Satz 3.1 noch etwas weiterführen.
Die a-priori Fehlerabschätzung (3.1.29) für das Finite-Elemente-Verfahren ist zu vergleichen mit der Abschätzung (2.2.37) für das Differenzenverfahren (5-Punkte-Diskretisierung mit
Shortley-Weller-Randapproximation auf polygonalen Gebieten):
max |eh | ≤
Ω
2
1 2
24 dΩ M4 (u)h
+ O(h3 ),
(3.1.30)
mit der Schranke M4 (u) für die vierten Ableitungen von u . Beide Abschätzungen zeigen dieselbe asymptotische Konvergenzordnung O(h2 ) , was aufgrund der verwendeten Diskretisierungsansätze auch zu erwarten ist. Die Unterschiede liegen zum einen in der Art der Norm, in der
der Fehler gemessen wird, und zum anderen in der benötigten Regularität der approximierten
Lösung. Beim Differenzenverfahren erhält man wegen der Verwendung des Maximumprinzips
punktweise Abschätzungen, wie sie auch der Anwender gern hat. (Der Ingenieur ist z.B. an
der maximalen Auslenkung einer belasteten Brückenkonstruktion interessiert.) Dagegen liefert
die Hilbert-Raum-Theorie für das Finite-Elemente-Verfahren zunächst nur Abschätzungen im
quadratischen Mittel, was etwa lokale Ausreißer“ an kritischen Stellen nicht ausschließt. (Dem
”
Brückenbauer genügt so etwas nicht, wenn Fehlerspitzen etwa in kritischen Lagerungspunkten
der Brücke auftreten können.) Wir werden später die Frage diskutieren, ob und wie man auch
für das Finite-Elemente-Verfahren Fehlerabschätzungen in der Maximumnorm herleiten kann.
Die in der Abschätzung (3.1.30) geforderte hohe Regularität der Lösung ist ein sehr viel schwerwiegender Nachteil unserer Analyse des Differenzenverfahrens, da diese Regularitätsstufe i.a.
auf Polygongebieten und unter realistischen Annahmen an die Problemdaten nicht erwartet
werden kann. Wir bemerken, daß man für das Finite-Elemente-Verfahren mit wesentlich mehr
technischem Aufwand optimale“ Maximumnorm-Fehlerabschätzungen der Form
”
max |eh | ≤ cM2 (u) h2 | ln h|
(3.1.31)
Ω
beweisen kann. Allerdings ist auch die abgeschwächte Annahme M2 (u) < ∞ i.a. noch zu
restriktiv. Für das Finite-Elemente-Verfahren ist auch noch unter der Minimalvoraussetzung
u ∈ H01 (Ω) wenigstens qualitative Konvergenz gesichert. Seinen eigentlichen Vorteil, nämlich
die große Flexibilität bei der Approximation von komplizierten Geometrien auf unstrukturierten Gittern werden wir später im Zusammenhang mit der Frage nach adaptiver Gittersteuerung
und Fehlerkontrolle erkennen.
84
3.1.2 Diskretes Maximumprinzip für Finite-Elemente-Approximationen
Als nächstes wollen wir zeigen, daß Galerkin-Verfahren mit finiten Elementen als Ansatzfunktionen tatsächlich eng verwandt mit Differenzenverfahren sind. Die Elemente der Steifigkeits”
matrix“ Ah des Finite-Elemente-Verfahrens für den Fall linearer“ Ansatzfunktionen auf einem
”
Dreiecksgitter werden exakt bestimmt.
Dazu wird zunächst ein einzelnes Dreieck T mit den Eckpunkten Pi (i = 1, 2, 3) betrachtet
(siehe Bild). Die dem Eckpunkt Pi gegenüberliegende Seite sei mit Si und die zugehörige
Höhe mit Hi bezeichnet. Die Seiten werden dabei als im Gegenuhrzeigersinn und die Höhen
gegen den Eckpunkt orientierte Vektoren aufgefaßt. Weiter bezeichne ψi die (stückweise lineare)
Knotenbasisfunktion zum Punkt Pi , welche auf T definiert ist durch ψi (Pk ) = δik , i, k = 1, 2, 3 .
Abbildung 3.3: Dreiecksschema
Es gilt ∇ψh ≡ konst. und wegen ψi (Pj ) = ψi (Pk ) = 0, i 6= j, k , hat ∇ψi in Richtung
Si die Komponente Null. Folglich zeigt ∇ψi in Richtung Hi und hat wegen ψi (Pi ) = 1 den
Betrag |Hi |−1 :
Hi
.
∇ψi =
|Hi |2
Wir erhalten also
(∇ψi , ∇ψj )T = |T |
(Hi , Hj )
.
|Hi |2 |Hj |2
Für den Winkel γij zwischen den Höhen Hi und Hj gilt
cos(γij ) =
(Hi , Hj )
|Hi | |Hj |
und, da γij gleich dem Winkel θij zwischen den Seitenvektoren Si und Sj ist, auch (Man
beachte die Orientierung von Si und Sj .):
cos(γij ) =
(Si , Sj )
|Si | |Sj |
Damit folgt bei Beachtung von 2|T | = |Hi | |Si | die Beziehung
(∇ψi , ∇ψj )T = |T |
(Si , Sj )
(Si , Sj )
=
.
|Si | |Sj | |Hi | |Hj |
4|T |
85
Hieraus lesen wir ab, daß
(∇ψi , ∇ψi )T > 0,
(∇ψi , ∇ψj )T ≤ 0,
i 6= j,
(3.1.32)
falls alle Winkel im Dreieck T kleiner oder gleich π/2 sind. Weiter ist nach Konstruktion
3
X
j=1
bzw.
N
X
j=1,j6=i
Für die Elemente aij =
P
ψj ≡ 1,
(∇ψi ,
3
X
j=1
∇ψj )T = 0,
|(∇ψi , ∇ψj )T | ≤ (∇ψi , ∇ψi )T ,
T ∈Th (∇ψj , ∇ψi )T
aii > 0,
i = 1, 2, 3.
der Matrix Ah erhalten wir somit, daß
aij ≤ 0
(i 6= j),
wenn alle Dreiecksinnenwinkel in der Triangulierung kleiner oder gleich π/2 sind. Darüber
hinaus gilt
X
X
|ai0 j | < ai0 i0 für ein i0 .
(3.1.33)
|aij | ≤ aii ,
j6=i
j6=i0
Die Steifigkeitsmatrix Ah ist in diesem Fall also (irreduzibel) diagonal-dominant“, von nicht”
”
negativem Typ“ und eine M -Matrix“. Wir fassen die sich daraus ergebenden Konsequenzen in
”
einem Satz zusammen.
Satz 3.2 (Maximumprinzip für finite Elemente): Wenn alle Innenwinkel der Triangulierung Th kleiner oder gleich π/2 sind, genügt das Finite-Elemente-Schema mit stückweise linearen Ansatzfunktionen einem diskreten Maximumprinzip, d.h.:
(n)
(∇vh , ∇ϕh ) ≤ 0 (n = 1, ..., N )
⇒
maxΩ vh ≤ max{0, max∂Ω vh }.
(3.1.34)
Ferner ist die Steifigkeitsmatrix Ah eine M -Matrix, d.h. es gilt A−1
h ≥ 0 sowie
x ∈ RN , Ah x ≥ 0
⇒
x ≥ 0.
(3.1.35)
Dieses Resultat kann so interpretiert werden, daß unter den gegebenen Voraussetzungen auch
die Finite-Elemente-Diskretisierung ein diskretes Maximumprinzip“ erfüllt. Leider gilt die kri”
tische Eigenschaft (3.1.32) praktisch nur in der oben beschriebenen Situation. Insbesondere
Finite-Elemente-Ansätze höherer Ordnung erfüllen dies nicht (z.B. quadratische Ansätze nur
auf gleichseitigen“ Triangulierungen).
”
Bemerkung 3.4: Im Spezialfall einer gleichförmigen, kartesischen Triangulierung (mit Kantenlänge h ) des Einheitsquadrats erhalten wir aus der obigen expliziten Darstellung für die
Matrixelemente aij = (∇ψi , ∇ψj ) die Beziehung:
aii = 4,
ai,i±1 = −1,
ai,i±m = −1;
86
alle anderen Elemente aij sind Null. In diesem Fall stimmt die Steifigkeitsmatrix AFh EM also
bis auf den Faktor h−2 mit der Matrix AFh DM des 5-Punkte-Operators“ überein:
”
AFh EM = h2 AFh DM .
Für die Elemente des zugehörigen Lastvektors“ gilt entsprechend:
”
Z
f ψi dx ≈ h2 f (Pi ) + O(h4 ) = h2 bFi DM + O(h4 ).
bFi EM =
(3.1.36)
(3.1.37)
Ω
Dies zeigt, daß aus algebraischer Sicht FEM und FDM eng verwandt sind. Für eine stückweise
bi-linearen“ Ansatz auf einer gleichförmigen Quadratzerlegung erhält man ein Analogon zu
”
einem kompakten 9-Punkte-Operator“ (siehe Abb. 3.4):
”
Abbildung 3.4: Differenzensterne
3.1.3 Approximation krummer Ränder
Zum Abschluß dieser einführenden Diskussion wollen wir noch darstellen, wie in der FEM krumme Ränder approximiert werden. Dazu sei angenommen, daß der Rand ∂Ω regulär genug ist,
daß die schwache Lösung u ∈ V := H01 (Ω) auch in H 2 (Ω) ist und der a-priori Abschätzung
kukH 2 ≤ cs kf k
(3.1.38)
genügt.
i) Der konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, konvexes Gebiet. Dieses sei überdeckt
”
durch eine reguläre Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets
[
Ωh := {T ∈ Th } ⊂ Ω,
auf dem Rand ∂Ω liegen. Die Länge der Polygonkanten von ∂Ω ist dann durch die Gitterweite
h der Triangulierung Th beschränkt (siehe Abb. 3.5).
Auf Ω wird nun zunächst der einfachste Finite-Elemente-Ansatz (mit linearen Formfunktionen) wie folgt definiert:
(1)
Vh
:= {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , vh|Ω\Ωh ≡ 0} ⊂ V = H01 (Ω).
(1)
Die zugehörigen Galerkin-Approximationen uh ∈ Vh
sind durch die Variationsgleichung
(∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh
(3.1.39)
87
bestimmt. Wegen der Teilraumbeziehung Vh ⊂ V gilt dann wieder für den Fehler eh := u − uh
die Bestapproximationsbeziehung (3.1.26).
Abbildung 3.5: Polygonale Approximation eines krumm berandeten Gebiets; Randstreifen Sh =
∪{ST } schraffiert.
Satz 3.3 (FEM auf konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen
k∇eh k ≤ (ci +cΩ )cs h kf k,
keh k ≤
(ci +cΩ )2 c2s h2 kf k,
(3.1.40)
(3.1.41)
mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ .
Beweis: (i) Sei Ih u ∈ Vh die natürliche Knoteninterpolierende von u , welche auf dem Streifen
Sh = Ω \ Ωh zu Null gesetzt wird. Für diese gilt wieder auf jeder Zelle T ∈ Th (wird später
gezeigt werden)
k∇(u − Ih u)kT ≤ ci hT k∇2 ukT ,
(3.1.42)
und folglich
k∇(u − Ih u)kΩh ≤ ci hk∇2 ukΩh .
Mit Hilfe der Approximationsbeziehung (3.1.26) ergibt sich somit
k∇eh k2Ω ≤ c2i h2 k∇2 uk2Ωh + k∇uk2Sh .
(3.1.43)
Es bleibt, das Integral über den Randstreifen Sh zu behandeln.
(ii) Für ein glatt berandetes Gebiet (d.h.: ∂Ω ist C 2 -parametrisiert.) ist nun |Sh | = O(h2 ) .
Um dies zu sehen, nehmen wir an, daß der Randabschnitt ∂ΩT , welcher durch Γ von ∂Ω
abgetrennt wird, als Graph einer Funktion ψ(s) der Bogenlänge über Γ aufgefaßt werden kann.
Diese nehme ihr Maximum ψ0 für s = s0 an, so daß
(ψ − ψ0 )(s0 ) = 0,
(ψ − ψ0 )′ (s0 ) = 0.
88
Durch Taylor-Entwicklung von ψ − ψ0 um s0 ergibt sich dann
max |ψ(s)| = max |ψ(s) − ψ0 | ≤ δ :=
Γ
Γ
1
2
max |ψ ′′ | h2T .
Γ
Folglich ist |Sh | ≤ ch2 . Damit ist bewiesen, daß
k∇eh kΩ ≤ chkukH 2,p .
(3.1.44)
(iii) Zur Abschätzung des Integrals über Sh gehen wir ähnlich vor wie beim Beweis der Poincaréschen Ungleichung. Sei T ∈ Th ein Randdreieck und ST der zugehörige Teilabschnitt des
Randstreifens Sh , welcher von der Kante Γ von T begrenzt ist. O.B.d.A. sei angenommen,
daß ein Rechteck QT mit Γ als kurzer Seite und Länge L > 0 (unabhängig von h ) ganz in Ω
enthalten ist (siehe Abb. 3.6).
Abbildung 3.6: Schema der Randapproximation
Sei nun weiter v ∈ C 1 (Ω) beliebig. Es bezeichne nΓ (x) den bzgl. Sh nach innen gerichteten
Normaleneinheitsvektor zu Γ im Punkt x ∈ Γ mit Parameterwert s . Damit gilt für 0 ≤ t ≤ δ :
Z t
∂r v(x + rnΓ (x)) dr,
v(x + tnΓ (x)) = v(x) +
0
bzw.
2
2
|v(x + tnΓ (x))| ≤ 2|v(x)| + 2δ
Z
ψ(s)
0
|∇v(x + rnΓ (x))|2 dr.
Wir integrieren dies zunächst über 0 ≤ t ≤ ψ(s) ≤ δ (Man beachte, daß für x ∈ Γ gilt
x + ψ(s)nΓ (x) ∈ ∂ΩT .),
Z
ψ(s)
0
2
2
|v(x + tnΓ (x))| dt ≤ 2δ|v(x)| + 2δ
2
Z
ψ(s)
0
und dann über x ∈ Γ und erhalten
Z
Z
Z
2
2
2
|v(x)| dx ≤ 2δ |v(x)| ds + 2δ
Γ
ST
|∇v(x + rnΓ (x))|2 dr,
ST
|∇v(x)|2 dx.
Für das Randintegral rechts erhalten wir mit Hilfe der Spurabschätzung
Z
|v(x)|2 ds ≤ cΩ kvk2H 1 (QT )
Γ
89
mit einer von maxΓ |ψ ′ | abhängigen Konstante cΩ . Damit gewinnen wir schließlich die Abschätzung
Z
(3.1.45)
|v(x)|2 dx ≤ cΩ h2 kvk2H 1 (Ω) ,
Sh
mit einer generischen Konstante cΩ . Durch das übliche Stetigkeitsargument überträgt sich diese
Abschätzung auf alle Funktionen v ∈ H 1 (Ω) .
Wir wenden die Abschätzung (3.1.45) nun für die Funktion |∇u| ∈ H 1 (Ω) an und erhalten
k∇uk2Sh ≤ cΩ h2 kuk2H 2 ,
so daß sich mit (3.1.43) schließlich das erste gewünschte Resultat ergibt:
k∇ek ≤ ci hk∇2 uk + cΩ hkukH 2 ≤ (ci +cΩ )cs h kf k.
(3.1.46)
Zur Abschätzung des L2 -Fehlers wird wieder ein Dualitätsargument verwendet. Sei z ∈ H01 (Ω)∩
H 2 (Ω) die Lösung des Hilfsproblems
−∆z = kek−1 e
in Ω,
z|∂Ω = 0.
Wie im Fall eines Polygongebiets argumentieren wir nun wie folgt:
kek = (∇e, ∇z) = (∇e, ∇(z − Ih z)) ≤ k∇ek k∇(z − Ih z)k.
Mit Hilfe der Interpolationsabschätzung (3.1.42) sowie der Randstreifenabschätzung (3.1.45) für
v := |∇z| folgt weiter
kek ≤ k∇ek ci hk∇2 zk + cΩ hkzkH 2 ≤ (ci +cΩ )hk∇ek kzkH 2 .
Hiermit folgt dann unter Verwendung des ersten Resultats (3.1.46) sowie der a-priori Schranke
kzkH 2 ≤ cs auch die zweite gewünschte Ungleichung
kek ≤ (ci +cΩ )2 c2s h2 kf k.
Dies vervollständigt den Beweis.
(3.1.47)
Q.E.D.
ii) Der nicht-konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, aber nicht notwendig konvexes
”
Gebiet. Dieses sei wieder überdeckt durch
S eine reguläre Triangulierung Th = {T } , so daß alle
Eckpunkte des Polygongebiets Ωh := {T ∈ Th } auf dem Rand ∂Ω liegen (siehe Abb. 3.7).
Die Länge der Polygonkanten von ∂Ωh ist dann durch die GitterweiteSh der Triangulierung
Th beschränkt. Ist Ω nicht konvex, so ist Ωh 6⊂ Ω . Der auf Ωh = {T ∈ Th } definierte
(1)
Finite-Elemente-Raum Vh ist dann auch nicht in V enthalten, und die Approximation wird
nicht-konform“ (bzgl. V = H01 (Ω) ) genannt. Die Analyse dieser Approximation gestaltet sich
”
technisch etwas schwieriger als im konformen Fall. Doch auch hierfür kann man Konvergenz mit
der optimalen Ordnung beweisen.
90
Abbildung 3.7: Approximation nicht-konvexer Randteile
Satz 3.4 (FEM auf nicht-konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf
einem glatt berandeten, nicht-notwendig konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen
k∇eh kΩ ≤ (ci +cΩ )cs hkf kΩ
keh kΩ ≤
(ci +cΩ )2 c2s h2 kf kΩ ,
(3.1.48)
(3.1.49)
mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ .
Beweis: Der Beweis wird in einer späteren Version dieses Skriptums gegeben werden. Q.E.D.
3.2 Allgemeine Finite-Elemente-Ansätze
91
Wir wollen nun Finite-Elemente-Ansatzräume allgemeineren Typs konstruieren und Fragen der
praktischen Realisierung der Methode diskutieren. Zunächst wird Ω als ein Polygongebiet (Polyeder in 3-D) angenommen. Seien Th Zerlegungen von Ω in Dreiecke oder Vierecke (Tetraeder
oder Hexaeder in 3-D), welche den im vorigen Abschnitt formulierten Bedingungen genügen. Für
die folgenden Konstruktionen von Finite-Elemente-Ansätzen verwenden wir die Bezeichnungen
n
o
n
o
X
X
Pr := p(x) =
cij xi1 xj2 , Qr := q(x) =
cij xi1 xj2 ,
0≤i+j≤r
0≤i,j≤r
für Polynom-Vektorräume im R2 (analog für solche im R3 ). Wir verwenden die Bezeichnungen
Th = {T } Zerlegung von Ω,
∂Th = {Γ} Menge aller Kanten (bzw. Flächen),
∂ 2 Th = {a}
Menge aller Eckpunkte ( Knoten“),
”
sowie die folgende Symbolik für einige typische Knotenwertevorgaben:
Abbildung 3.8: Funktionswerte vh (a) sowie vh (a), ∇vh (a) (links), Normalableitung ∂n vh (m)
in Seitenmitten (Mitte), Funktionswerte vh (a), ∇vh (a), ∇2 vh (a) (rechts).
Ein Finite-Elemente-Ansatz ist definiert durch Vorgabe eines Polynomraumes P (T ) ⊂ Pr (T )
oder P (T ) ⊂ Qr (T ) auf T ∈ Th sowie eines geeigneten Satzes von Knotenwerten“ (gegeben
”
durch lineare Knotenfunktionale“), z.B.:
”
{vh (a), vh (m), ∂n vh (m), ∇vh (a), (vh , 1)Γ , (vh , 1)T , . . . },
welcher Polynome aus P (T ) eindeutig bestimmt.
Definition 3.1 (Unisolvenz): Ein Polynomraum P (T ) und ein zugehöriger Satz von linearen
Knotenfunktionalen“ K(T ) heißen unisolvent“, wenn jedes p ∈ P (T ) eindeutig durch die
”
”
Vorgabe von χ(p) für alle χ ∈ K(T ) bestimmt ist.
Definition 3.2 (Lagrange- und Hermite-Ansatz): Man spricht bei einem FE-Ansatz P (T )
mit zugehörigem Satz von Knotenfunktionalen {χr , r = 1, ..., R} von Lagrange-Elementen“,
”
wenn die Knotenfunktionale nur auf Funktionswerte zurückgreifen; werden auch Ableitungswerte
verwendet, spricht man von Hermite10 -Elementen“.
”
10
Charles Hermite (1822-1901): französischer Mathematiker; Prof. an der École Polytechnique und der Sorbonne
in Paris; Beiträge zur Zahlentheorie und zur Theorie elliptischer Funktionen; Beweis der Transzendenz von e .
92
Notwendig für Unisolvenz ist offenbar dim P (T ) = #K(T ) und hinreichend, daß für ein p ∈
P (T ) aus χ(p) = 0 für alle χ ∈ K(T ) notwendig p ≡ 0 folgt. Dies wird in der Regel zum
Nachweis von Unisolvenz verwendet.
Definition 3.3 (Interpolation): Für jede Zelle T ∈ Th sei ein Polynomraum P (T ) mit
Dimension R und ein Satz KT = {χr , r = 1, ..., R} von Knotenfunktionalen
χr : H m (T ) → R
(r = 1, ..., R),
spezifiziert, welche unisolvent“ sind. Durch die Vorgabe
”
χr (Ih v) = χr (v),
r = 1, . . . , R,
ist dann eindeutig eine Finite-Elemente-Interpolierende“ Ih v ∈ P (T ) definiert.
”
Durch Zusammensetzen der zunächst zellweise definierten Formfunktionen vT ∈ P (T ) erhält
man global definierte Funktionen
vh : Ω → R,
vh|T := vT ,
T ∈ Th ,
mit denen der Finite-Elemente-Ansatzraum Vh gebildet wird. Durch Gleichsetzen geeigneter
Knotenwerte auf dem gemeinsamen Rand Γ = T ∩T ′ jeweils benachbarter Zellen wird Stetigkeit,
Differenzierbarkeit und auf analogem Wege auch die Randbedingung vh|∂Ω = 0 implementiert.
Die Dimension des endlich dimensionalen Teilraumes Vh ⊂ V ist dann gleich der Anzahl der
Knotenfunktionalwerte zur eindeutigen Festlegung einer Funktion vh ∈ Vh .
Definition 3.4 (Konformität): Ein Finite-Elemente-Ansatzraum Vh dieser Art heißt H01 ”
konform“, wenn Vh ⊂ H01 (Ω), und andernfalls nicht-konform“.
”
A) Dreieckselemente im R2 : Als erstes betrachten wir Finite-Elemente-Ansätze auf Triangulierungen von Polygongebieten.
1) Konstanter Ansatz: P (T ) = P0 , dim P (T ) = 1 .
Mit konstanten Polynomansätzen kann offensichtlich für die Variationsgleichung (3.1.2) keine
konforme Diskretisierung gewonnen werden. Diese spielen aber bei anderen Typen von variationellen Formulierungen, den sog. dual-gemischten“, eine Rolle
”
2) Linearer Ansatz: P (T ) = P1 , dim P (T ) = 3 .
Der Polynomraum P1 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), i = 1, 2, 3} sind
unisolvent, denn für p ∈ P1 (T ) mit p(ai ) = 0 gilt notwendig p|∂T ≡ 0 und damit auch p ≡ 0 .
Mit dem Ansatz
(1)
Vh
= {vh : Ω → R| vh|T ∈ P1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}.
erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine
gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P1 (Γ) . Folglich ist vh stetig, da seine
Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten von Γ haben.
93
Einen nicht-konformen Ansatz erhält man durch
(1)
Ṽh
= {vh : Ω → R| vh|T ∈ P1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}.
Die Unisolvenz folgt analog wie die des entsprechenden konformen Ansatzes. Dieses nichtkonforme lineare“ Element spielt z. B. eine Rolle bei der Diskretisierung der Navier-Stokes”
Gleichungen in der Strömungsmechanik.
3) Quadratischer Ansatz: P (T ) = P2 , dim P (T ) = 6 .
Der Polynomraum P2 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), ψi (p) = p(mi ),
i = 1, 2, 3} sind unisolvent. Für p ∈ P2 (T ) mit p(ai ) = p(mi ) = 0 gilt notwendig p|∂T ≡ 0 .
Dies impliziert, daß ∇p(ai ) = 0 , woraus wegen ∂i p ∈ P1 (T ) wiederum ∇p ≡ 0 und schließlich
p ≡ 0 folgt. Mit dem Ansatz
(2)
Vh
= {vh : Ω → R| vh|T ∈ P2 , vh stetig in Eckpunkten und Kantenmitten,
vh = 0 in solchen Punkten auf ∂Ω}.
erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine
gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P2 (Γ) . Folglich ist vh stetig, da seine
Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und dem Mittelpunkt von Γ haben.
R Alternativ zu den Werten in den Kantenmitten m kann man auch die
−1
Mittelwerte |Γ|
Γ vh ds über Kanten Γ ∈ ∂Th als Knotenwerte verwenden.
Der nicht-konforme Ansatz
(2)
Ṽh
= {vh : Ω → R| vh|T ∈ P2 , vh stetig in jeweils zwei Gauß-Punkten auf Kanten,
vh = 0 in solchen Punkten auf ∂Ω}
ist nicht unisolvent, denn es existieren nicht-triviale, stückweise quadratische Funktionen, welche in allen Knotenpunkten verschwinden. Man betrachte dazu auf jeder Kante die LegendrePolynomen L2 zweiten Grades, deren Nullstellen gerade die beiden Gauß-Punkte m1 , m2 sind.
Sie können wegen ihrer Symmetrie zum Kantenmittelpunkt so normiert werden, daß sie in den
Eckpunkten a gleiche Werte L2 (a) = 1 haben. Dann läßt sich eine Funktion L ∈ P2 (T ) finden,
durch konforme Interpolation in Eckpunkten und Seitenmitten: L(a) = 1 , L(m) = L2 (m) . Auf
jeder Kante ist dann L ≡ L2 , so daß sich ein Widerspruch zur Unisolvenz des Ansatzes ergibt.
Eine weitere nicht-konforme Variante des quadratischen Elements (das sog. Morley11 -Platten”
element“) erhält man bei Wahl der Knotenwerte {vh (a), ∂n vh (m)} . Dieser Ansatz ist wieder
unisolvent. Für p ∈ P2 (T ) folgt aus p(ai ) = ∂n p(mi ) = 0, i = 1, 2, 3 , notwendig ∂τ p(mi ) = 0
und somit ∇p(mi ) = 0 . Wegen ∂i p ∈ P1 (T ) folgt ∇p ≡ 0 und damit auch p ≡ 0 .
11
L.S.D. Morley (????-????): englischer Ingenieur; Forscher an der Brunel University in Uxbridge, England;
Beiträge zur FEM für nichtlineare Schalenmodelle.
94
Das Morley-Element ist zwar nicht-konform bzgl. der H 1 - wie auch der H 2 -Norm, trotzdem
kann es bei geeigneter Modifikation der variationellen Formulierungen,
X
uh ∈ VhM :
(∇2 uh , ∇2 ϕh )T = (f, ϕh ) ∀ϕh ∈ VhM ,
T ∈Th
sogar zur Approximation des biharmonischen Operators ∆2 u = f verwendet werden.
5) Kubischer Ansatz (sog. kubisches Membran-Element“: P (T ) = P3 , dim P (T ) = 10 .
”
Mit dem Ansatz
(3)
Vh
={vh : Ω → R| vh|T ∈ P3 , vh stetig in Eckpunkten und in je
zwei Gauß-Punkten auf Kanten, vh = 0 in solchen Punkten auf ∂Th }.
ist H01 -konform. Denn der Sprung von [vh ] über eine gemeinsame Kante Γ zweier Dreiecke T1
und T2 ist in P3 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame
Werte in den beiden Endpunkten und zwei Gauß-Punkten auf Γ haben. Alternativ zu den GaußPunkten auf den Kanten kann man auch in jedem Knoten die beiden partiellen Ableitungen,
d.h. den Gradienten ∇vh (a) , als Knotenwerte verwenden. Auch damit erhält man einen H01 (3)
(3)
konformen Ansatzraum V̂h ; dieser ist offenbar echt kleiner als Vh (Übungsaufgabe).
Zur Diskretisierung der biharmonischen Gleichung kann man wieder eine nicht-konforme Variante mit den Knotenwerten {vh (a), ∂n vh (m1 ), ∂n vh (m2 ), vh (z)} ( m1 , m2 zwei Gauß-Punkte
auf Γ und z der Mittelpunkt von T ) verwenden. Ein H 2 -konformes Platten-Element erhält
man durch den sog. Clough-Tocher-Ansatz“ als zusammengesetztes“ Element ( vh ∈ C 1 (T )
”
”
stückweise kubisch).
6) Quartischer Ansatz: P (T ) = P4 (T ) , dim P (T ) = 15 .
Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), vh (m1 ), vh (m2 )} (m1 , m2 die beiden GaußPunkte auf jeder Kante Γ ∈ ∂Th ) erhält man hier einen H 1 -konformen Ansatz (Übungsaufgabe).
95
7) Quintischer Ansatz (sog. Argyris12 -Plattenelement“): P (T ) = P5 (T ) , dim P (T ) = 21 .
”
Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), ∇2 vh (a), ∂n vh (m)} erhält man hier sogar einen
H 2 -konformen Ansatz (Übungsaufgabe). Dieses finite Element ist ein Beispiel für einen konformen Ansatz zur Lösung der biharmonischen Gleichung ∆2 u = f , für welche stetig differenzierbare Übergänge von Zelle zu Zelle erforderlich sind.
B) Viereckselemente: Als nächstes betrachten wir Finite-Elemente-Ansätze auf (kartesischen)
Rechteckszerlegungen.
1) Bi-linearer Ansatz: P (T ) = Q1 = span{1, x1 , x2 , x1 x2 } , dim P (T ) = 4 . Der Polynomraum
Q1 (T ) und der Satz von Knotenfunktionalewn {χi (p) = p(ai ), i = 1, . . . , 4} sind unisolvent. Ein
p ∈ Q1 (T ) ist entlang der Kanten von T linear. Aus p(ai ) = 0 folgt also p|∂T ≡ 0 und weiter
∇p(ai ) = 0 . Wegen ∂i p ∈ P1 (T ) impliziert dies ∇p ≡ 0 und schließlich p ≡ 0 . Der Ansatz
(1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}
ist H01 -konform, da die Sprünge von vh entlang von Kanten linear sind.
Der naheliegende nicht-konforme Ansatz
(1)
Ṽh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}
ist aber i.a. nicht unisolvent, da z.B. die Funktion vh (x1 , x2 ) = x1 x2 in den Kantenmitten
des Quadrats T1 = [−1, 1] × [−1, 1] verschwindet. Auf T1 erhält man aber durch P (T ) =
span{1, x1 , x2 , x21 − x22 } einen mit den Kantenmitten als Knotenfunktionale unisolventen Ansatz. RAlternativ zu den Funktionswerten in den Seitenmitten kann man auch die Mittelwerte
(1)
|Γ|−1 Γ vh ds über die Kanten als Knotenwerte verwenden. Dies ergibt aber einen von Ṽh
verschiedenen Ansatzraum.
2) Bi-quadratischer Ansatz: P (T ) = Q2 = span{1, x1 , x2 , x21 , x1 x2 , x22 , x21 x2 , x1 x22 , x21 x22 } ,
dim P (T ) = 9 . Die Konstruktion eines zulässigen“ Satzes von Knotenwerten ist Übung.
”
3) Reduzierter bi-quadratischer Ansatz (sog. Wilson13 -Membran-Element“):
”
P (T ) = P2 (T ) ⊕ span{x21 x2 , x1 x22 } , dim P (T ) = 8 . Dieser Ansatz wird mit den Knotenwerten
12
John Argyris (1916-2004): deutscher Bauingenieur; Prof. in Stuttgart; einer der Erfinder“ der Finite”
Elemente-Methode.
13
E.L. Wilson (????-????): amerikanischer Ingenieur; Publ.: K. Bathe, E.L Wilson: Numerical Methods in Finite
Element Analysis, Prentice-Hall, New Jersey, 1976.
96
{vh (a), vh (m)} H 1 -konform.
4) Bi-kubischer Ansatz: P (T ) = Q3 = span{1, x1 , x2 , x21 , ..., x31 x32 } , dim P (T ) = 16 .
Die Konstruktion eines zulässigen“ Satzes von Knotenwerten wird als Übung gestellt.
”
5) Reduzierter bi-kubischer Ansatz (sog. Adini14 -Platten-Element“):
”
P (T ) = P3 (T ) ⊕ span{x31 x2 , x1 x32 } , dim P (T ) = 12 . Dieser Ansatz wird mit den Knotenwerten
{vh (a), ∇vh (a)} unisolvent und H 1 -konform, ist aber nicht H 2 -konform.
Viele der aufgeführten zwei-dimensionalen Finite-Elemente-Ansätzen haben natürliche Erweiterungen auf drei Dimensionen. Die gebräuchlichsten Beispiele sind:
1) Lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
2) Nicht-konf., lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 .
Mit den Funktionswerten in den Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent,
aber nicht-konform.
3) Quadratisches Tetraederelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x21 , x22 , x23 } ,
dim P (T ) = 10 . Mit den Funktionswerten in den Ecken und den Kantenmitten als Knotenwerte
ist dieser Ansatz unisolvent und H 1 -konform.
4) Kubisches Tetraederelement: P (T ) = P3 , dim P (T ) = 20 .
Mit den Funktionswerten in den Ecken, in zwei Gauß-Punkten auf den Kanten und in den
Seitenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
14
A. Adini (????-????): ????
97
5) Tri-lineares Quaderelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x1 x2 x3 },
dim P (T ) = 8 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz
unisolvent und H 1 -konform.
Ein zugehöriges nicht-konformes Quaderelement erhält man durch den Ansatz
P (T ) = span{1, x1 , x2 , x3 , x21 − x22 , x21 − x23 }, dim P (T ) = 6 . Mit den Funktionswerten in den
Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent.
6) Tri-quadratisches Quaderelement: P (T ) = span{1, x1 , x2 , x3 , ..., x21 x22 x23 },
dim P (T ) = 27 . Mit den Funktionswerten in den Eckpunkten, den Kantenmitten, den Seitenmitten und dem Mittelpunkt als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
In allgemeinen Situationen können die Zellen bzgl. des Koordinatensystems gedreht oder
gezerrt werden. Daraus folgt, daß es Fälle gibt, in denen man für zwei Zellen der Zerlegung
Th nicht denselben Ansatz nehmen kann (z.B. das bi-lineare Viereckselement). Deshalb müssen
wir uns bei der Definition von Finite-Elemente-Ansätzen von dem festen Koordinatensystem
befreien. Dies induziert die Idee des Referenzelements“. Wir verwenden als Referenzelement
”
ein natürliches Einheitselement T̂ (Einheitsdreieck, Einheitsviereck, ...) und definieren zunächst
einen Polynomansatz P̂ (T̂ ) auf diesem Referenzelement.
Sei σT eine (polynomiale) Transformation des Referenzelements auf das ( physikalische“)
”
Element mit der Inversen σT−1 : T → T̂ . Der Ansatz auf der Zelle T ist dann gegeben durch
P (T ) := {vh : T → R| vh (σT (·)) ∈ P̂ (T̂ )}.
(3.2.50)
Der Funktionenraum P (T ) ist nicht notwendig ein Raum von Polynomen, auch wenn P̂ (T̂ ) ein
solcher ist. Dies liegt daran, daß im Allg. die inverse Abbildung σT−1 und damit die Funktion
vh (x) = vh (σ(σ −1 (·))) nicht polynomial ist, z.B. im Fall (echt) bilinearer Abbildungen σT .
Wenn man T aus T̂ durch eine Verschiebung, eine Rotation, eine Scherung und eine Skalierung
gewinnen kann, so ist σT eine affin-lineare Transformation:
σT (x̂) = BT x̂ + bT
mit einer Matrix BT ∈ Rd×d und einem Verschiebungsvektor bT ∈ Rd . Dies ist möglich bei
Dreiecken (in 2-D) bzw. Tetraedern (in 3-D) sowie bei Parallelogrammen (in 2-D) bzw. Parallelepipeden (in 3-D). Für allgemeine (konvexe) Vierecke (in 2-D) oder Hexaeder (in 3-D) benötigt
man für die Transformation echt bi- bzw. tri-lineare Abbildungen.
Wir gehen nun zum allgemeinen d-dimensionalen Fall über und betrachten Zerlegungen Th =
98
{T } eines Gebiets Ω ⊂ Rd in d-Simplizes. Dabei ist ein (nicht degeneriertes) Simplex T ⊂ Rd
die konvexe lineare Hülle von d + 1 linear unabhängigen Punkten ai ∈ Rd , i = 0, ..., d:
n
d
T = x∈R |x=
d
X
i
λi a ,
d
X
i=0
i=0
o
λi = 1, 0 ≤ λi ≤ 1 .
(3.2.51)
Das System {ai , i = 0, ..., d} heißt linear unabhängig, wenn die erzeugenden Vektoren {wi =
ai − a0 , i = 1, ..., n} eine Basis des Rd bilden. Die einfachsten Beispiele sind wieder Dreiecke für
d = 2 und Tetraeder für d = 3 . Sei T̂ das Einheitssimplex im Rd , welches von den Punkten
e0 := 0 , ei = (δ1i , ..., δdi )T , i = 1, ..., d , aufgespannt wird.
Hilfssatz 3.2 (Referenztransformation): Jedes (nicht degenerierte) Simplex T ⊂ Rd läßt
sich mittels einer umkehrbaren affinen Abbildung
x = σT (x̂) := BT x̂ + bT ,
BT ∈ Rd×d , bT ∈ Rd ,
(3.2.52)
aus dem Einheitssimplex T̂ gewinnen: T = BT T̂ + bT . Dabei ist die Umkehrabbildung gegeben
durch x̂ = σT−1 (x) = BT−1 x−BT−1 bT .
Beweis: Wir lassen im folgenden den Zusatz T weg. Sei A ∈ Rd×d die reguläre Matrix, welche
die Basis {wi = ai − a0 , i = 1, ..., d} auf die kartesische Einheitsbasis {ei , i = 1, ..., d} abbildet:
ei = Awi , i = 1, ..., d . Man gewinnt ihre Elemente aνµ als Lösungen der Gleichungssysteme
n
X
aνµ wµi = eiν ,
i = 1, ..., d ,
µ=1
für ν = 1, ..., d. Die Koeffizientenmatrix (wµi )di,µ=1 enthält die linear unabhängigen Vektoren
wi , i = 1, ..., d, als Zeilenvektoren und ist folglich regulär. Die affine Abbildung x̂ = Ax − Aa0
ist
Pd Simplex T auf das Einheitssimplex T̂ ab, denn für x =
Pddann iumkehrbar und bildet das
λ
a
∈
T
ist
(Man
beachte
i=1 λi = 1 .)
i=0 i
Ax − Aa0 =
und umgekehrt für x̂ =
A−1 x̂ + a0 =
Pd
d
X
i=0
i
i=0 λi e
d
X
i=0
λi A(ai − a0 ) =
d
X
λi ei ∈ T̂ ,
d
X
λi ai + (1 −
i=0
∈ T̂
λi A−1 ei + a0 =
d
X
i=0
λi wi + a0 =
i=0
Dies komplettiert den Beweis mit BT := A−1 und bT := a0 .
d
X
i=1
λi )a0 ∈ T .
Q.E.D.
Bemerkung 3.5: Zu Hilfssatz 3.2 gibt es ein Analogon für Vierecks-Zerlegungen im R2 sowie
Hexaeder-Zerlegungen im R3 . Zu jedem konvexen Viereck T ∈ R2 oder Hexaeder T ∈ R3
( 6-Flächner“) existieren bi- bzw. tri-lineare Abbildungen σT : T̂ → T des Einheitsquadrats
”
bzw. Einheitswürfels T̂ auf T . Dabei werden die Eckpunkte von T̂ auf die Eckpunkte von T
sowie die Kanten bzw. Seitenflächen von T̂ auf die Kanten bzw. Seitenflächen von T abgebildet
(jeweils in derselben Orientierung).
99
Die Erzeugung von Finite-Elemente-Ansätzen über Transformation von einem Referenzelement hat auch den Zweck, auf allgemeinen Vierecks- oder Hexaeder-Zerlegungen konforme
Ansätze zu gewinnen. Wir wollen das anhand des bilinearen Ansatzes diskutieren:
(1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Knoten, vh = 0 in Knoten auf ∂Ω}.
Wir betrachten allgemeine Vierecke T und T ′ , die eine gemeinsame Kante Γ haben, und setzen
P (T ) = P1 ⊕ span{x1 x2 }. Der Sprung von vh ist zwar gleich Null in den Endpunkten von Γ ,
doch ist er im Allg. nicht linear auf Γ , so daß die Stetigkeit über Γ nicht gesichert ist. Hierfür
(1)
muß erreicht werden, daß die Restriktion von vh ∈ Vh auf alle Kanten Γ ∈ ∂Th linear ist.
(1)
Dies kann durch Konstruktion von Vh mit Hilfe der bilinearen Transformationen σT : T̂ → T
erreicht werden.
Für eine bi-lineare Transformation σT : T̂ → T ist die Inverse σT−1 : T → T̂ i.a. nicht bi-linear.
In diesem Fall ist der gemäß (3.2.50) erzeugte lokale Ansatzraum P (T ) auch kein Polynomraum.
Dennoch ist v|Γ auf jeder Kante Γ ∈ ∂Th linear, so daß Stetigkeit in allen Eckpunkten auch
automatisch globale Stetigkeit auf Ω sowie v|∂Ω = 0 garantiert. Dieser Transformationsansatz
löst also das Problem der globalen Stetigkeit.
Definition 3.5 (Parametrischer Ansatz): Der Ansatz P (T ) wird parametrisch“ genannt,
”
wenn er durch Transformationen σT : T̂ → T von einem Referenzelement T̂ erzeugt wird. Er
heißt isoparametrisch“, wenn die Transformation σT vom selben Polynomtyp wie die Ansatz”
funktionen in P̂ (T̂ ) ist.
Der Begriff des isoparametrischen“ Finite-Element-Ansatzes läßt sich auf höheren Polynomgrad
”
r ≥ 2 übertragen. Dies wird wichtig bei der Approximation eines krummen Randes bei Verwendung von Ansätzen höherer Ordnung. (siehe Bild mit quadratischer“ Randapproximitation).
”
Die einfache Polygonzugapproximation würde hier zu einer Ordnungsreduktion führen:
k∇(u − uh )k ≤ c hr kukr + hkuk2 ,
im Gegensatz zur optimalen Abschätzung
k∇(u − uh )k ≤ chr kukr .
Abbildung 3.9: Parametrische Randapproximation
100
3.3 Interpolation mit finiten Elementen
Dieser Abschnitt ist dem grundlegenden Aspekt bei der mathematischen Analyse der Methode
der finiten Elemente gewidmet: Wie gut lassen sich hinreichend glatte Funktionen durch stückweise polynomiale approximieren? Wir gehen von der im vorigen Abschnitt anhand von Beispielen beschriebenen abstrakten Situation aus. Sei T ⊂ Rd eine Zelle eines Finite-Elemente-Gitters
Th ; der Durchmesser von T wird wieder mit diam(T ) = hT und der Radius einer (maximalen)
einbeschriebenen Kugel mit ρT bezeichnet.
Wir betrachten im folgenden ausschließlich parametrische“ Finite-Elemente-Ansätze. Jedes
”
T ∈ Th sei Bild eines Referenz-Einheitselements“ T̂ ⊂ Rd mit Durchmesser diam(T̂ ) = ĥ ≈ 1
”
und Inkugelradius ρ̂ > 0. Die zugehörigen Abbildungen σT : T̂ → T seien der Einfachheit halber
als affin-linear angenommen:
BT ∈ Rd×d , bT ∈ Rd .
x = σT (x̂) = BT x̂ + bT ,
(3.3.53)
Der Fall allgemeiner Vierecke mit erzeugenden bilinearen Transformationen wird gegebenenfalls
in Bemerkungen berücksichtigt werden.
Allgemeine Interpolationsaufgabe: Auf einem beliebigen, aber festen Element T (z.B. dem
Einheitselement T̂ ) seien ein Vektorraum P (T ) von Polynomen über T mit dim P (T ) = R
sowie ein System von linearen Knotenfunktionalen“ KT = {χr , r = 1, ..., R} gegeben, so daß
”
die folgenden Bedingungen erfüllt sind:
(i) Der Ansatz ist unisolvent:
q ∈ P (T ) : χr (q) = 0 (r = 1, ..., R)
⇒
q = 0.
(3.3.54)
(ii) Für ein m ≥ 1 gilt Pm−1 ⊂ P (T ) .
(iii) Die Knotenfunktionale aus KT sind stetig auf H m (T ) :
|χr (v)| ≤ cb kvkm;T ,
v ∈ H m (T ), r = 1, ..., R.
(3.3.55)
Unter der Bedingung (i) ist die zugehörige Lagrangesche bzw. Hermitesche Interpolationsaufgabe eindeutig lösbar, d.h: Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes
Interpolationspolynom“ IT v ∈ P (T ) mit den Eigenschaften
”
χr (IT v) = χr (v),
r = 1, ..., R.
Wenn die Knotenfunktionale zu singulär“ sind, um für Funktionen aus H m (Ω) definiert zu
”
sein (z.B. die Ableitung ∂nm−1 v(m) in einer Seitenmitte m ∈ ∂T ), kann auch ein stärkerer
Sobolew-Raum H m,p (Ω) mit p > d verwendet werden. Wir werden diesen Fall hier aber nicht
weiter verfolgen.
Notation: Im folgenden verwenden wir eine gebräuchliche Multiindex“-Schreibweise für mehr”
fach indizierte Größen. Für einen Indexvektor α = (α1 , ..., αd )T ∈ Zd mit ganzzahligen, nichtnegativen Komponenten setzen wir
|α| :=
d
X
i=1
αi ,
xα :=
d
Y
i=1
xαi i ,
Dα :=
d
Y
i=1
∂iαi ,
o
n
X
Pk = q(x) =
aα xα .
|α|≤k
101
Mit dieser Notation schreiben sich z.B. die Sobolew-Normen bzw. -Halbnormen über T in der
Form
1/2
1/2
X
X
.
kD α vk2T
, |v|m;T =
kD α vk2T
kvkm;T =
|α|=m
0≤|α|≤m
Wir leiten nun eine Reihe von technischen Hilfssätzen ab, die am Schluß zu den gewünschten allgemeinen Abschätzungen für den Interpolationsfehler bei Finite-Elemente-Ansätze führen
werden. Die dabei verwendete Schlußweise geht in diesem Zusammenhang auf Bramble und
Hilbert (1971) zurück, weswegen die ganze Theorie auch Bramble-Hilbert-Theorie“ und das
”
Hauptresultat Bramble-Hilbert-Lemma“ genannt werden.
”
Hilfssatz 3.3 (Nullraum von Ableitungsoperatoren): Jede Funktion v ∈ H m (T ) mit der
Eigenschaft
Dα v = 0 ,
|α| = m,
(3.3.56)
ist fast überall gleich einem Polynom aus Pm−1 (T ) .
T
k
Beweis: Aus den Voraussetzungen folgt D β D α v ≡ 0 für beliebiges β und somit v ∈ ∞
k=1 H (T ) .
m
Nach dem Sobolewschen Einbettungssatz ist damit v ∈ C (T ), so daß sich die Behauptung mit
Hilfe klassischer“ Argumente ergibt.
Q.E.D.
”
Hilfssatz 3.4 (Polynomprojektion): Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig
bestimmtes Polynom q ∈ Pm−1 (T ) mit der Eigenschaft
Z
Dα (v − q) dx = 0 , 0 ≤ |α| ≤ m − 1 .
(3.3.57)
T
Beweis: Zur Lösung der Aufgabe machen wir den Ansatz
X
q(x) :=
ξ β xβ ∈ Pm−1 (T )
|β|≤m−1
mit unbekannten Koeffizienten ξ = (ξ β )|β|≤m−1 (bei lexikographischer Anordnung der Indexkomponenten). Dies führt auf das quadratische, lineare Gleichungssystem
Z
Z
X
β
α β
D α v dx , 0 ≤ |α| ≤ m − 1.
ξ
D x dx =
T
T
0≤|β|≤m−1
Dessen Koeffizientenmatrix
M=
Z
Dα xβ dx
T
0≤|α|,|β|≤m−1
ist regulär. Andernfalls gäbe es ein ξ = (ξ β )|β|≤m−1 6= 0 mit M ξ = 0 . Das damit gebildete
P
Polynom q(x) = 0≤|β|≤m−1 ξ β xβ ∈ Pm−1 (T ) hätte dann die Eigenschaft
Z
Dα q dx = 0 ,
T
0 ≤ |α| ≤ m − 1 ,
(3.3.58)
102
woraus offensichtlich q ≡ 0 und damit der Widerspruch ξ ≡ 0 folgte. Also existiert ein eindeutig
bestimmtes Polynom mit den verlangten Eigenschaften.
Q.E.D.
Hilfssatz 3.5 (Verallg. Poincarésche Ungleichung): Für jede Funktion v ∈ H m (T ) mit
der Eigenschaft
Z
D α v dx = 0 , 0 ≤ |α| ≤ m − 1 ,
(3.3.59)
T
gilt mit einer Konstante c0 = c(d, m, T )
kvkm;T ≤ c0 |v|m;T .
(3.3.60)
Beweis: Angenommen, die Behauptung wäre falsch. Dann existierte eine Folge von Funktionen
vk ∈ H m (T ) , k ∈ N mit den Eigenschaften
1 = kvk km;T ≥ k|vk |m;T ,
k ∈ N.
(3.3.61)
Aufgrund der Kompaktheit der Einbettung von H m (T ) in H m−1 (T ) konvergiert eine Teilfolge,
welche wir wieder mit (vk )k∈N bezeichnen, in H m−1 (T ) gegen ein v ∈ H m−1 (T ):
kvk − vkm−1;T → 0 (k → ∞).
(3.3.62)
Mit der Annahme folgt |vk |m;T → 0 (k → ∞) . Also ist (vk )k∈N Cauchy-Folge in H m (Ω) mit
Limes ṽ ∈ H m (T ) . Wegen vk →H m−1 v muß ṽ = v sein. Damit folgt |v|m;T = 0. Nach Hilfssatz
3.3 ist also v ∈ Pm−1 (T ) und besitzt die Eigenschaft
Z
Z
α
D α vk dx = 0 , 0 ≤ |α| ≤ m − 1 .
(3.3.63)
D v dx = lim
T
k→∞ T
Dies bedeutet aber wegen Hilfssatz 3.4 notwendig v ≡ 0, was im Widerspruch zur Annahme
kvkm;T = limk→∞ kvk km;T = 1 steht.
Q.E.D.
Nach diesen Vorbereitungen können wir das zentrale Resultat dieses Abschnitts, das sog.
Bramble15 -Hilbert16 -Lemma, beweisen.
Satz 3.5 (Bramble-Hilbert-Lemma): Sei F (·) : H m (T ) → R ein beschränktes, sublineares
Funktional, welches auf Pm−1 (T ) verschwindet, d.h.:
(i)
(ii)
(iii)
15
|F (v)| ≤ c1 kvkm;T
(Beschränktkeit),
|F (u + v)| ≤ c2 {|F (u)| + |F (v)|}
F (q) = 0,
q ∈ Pm−1 (T )
(Sublinearität),
(Annulierungseigenschaft).
James H. Bramble (1932-): US-amerikanischer Mathematiker: Prof. an der Cornell University und der Texas
A&M University; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode und von Iterationsverfahren,
insbesondere Mehrgitterverfahrens.
16
Stephen Hilbert (????-): US-amerikanischer Mathematiker: Prof. am Ithaca College, New York; bekannt durch
das sog. “Bramble-Hilbert-Lemma”.
103
Dann gilt mit der Konstante c0 aus Hilfssatz 3.5:
|F (v)| ≤ c0 c1 c2 |v|m;T ,
v ∈ H m (T ).
(3.3.64)
Beweis: Für ein v ∈ H m (T ) gilt mit beliebigem q ∈ Pm−1 (T ) :
|F (v)| = |F (v − q + q)| ≤ c2 {|F (v − q)| + |F (q)|} ≤ c1 c2 kv − qkm;T .
Wir wählen nun q ∈ Pm−1 (T ) als das gemäß Hilfssatz 3.4 zu v gehörende Polynom, so daß
gemäß Hilfssatz 3.5 folgt:
kv − qkm;T ≤ c0 |v − q|m;T = c0 |v|m;T .
Dies impliziert dann
|F (v)| ≤ c3 |v|m;T ,
mit c3 := c0 c1 c2 , was zu beweisen war.
Q.E.D.
Korollar 3.1 (Allg. Interpolationssatz): Seien die obigen Voraussetzungen erfüllt. Für jede
Funktion v ∈ H m (T ) und das zugehörige interpolierende Polynom IT v ∈ P (T ) gilt bzgl. einer
beliebigen stetigen Halbnorm | · | auf H m (T ):
|v − IT v| ≤ c |v|m;T
(3.3.65)
mit einer Konstante c = c(d, m, R, T, | · |).
Beweis: O.B.d.A. sei |v| ≤ kvkm;T , v ∈ H m (T ) . Durch F (v) := |v − IT v| wird auf H m (T ) ein
sublineares Funktional definiert. Die Interpolierende IT v besitzt die Darstellung
IT v =
R
X
χr (v)ϕ(r)
r=1
mit der durch die Bedingung χr (ϕ(s) ) = δrs , (r, s = 1, ..., R) eindeutig bestimmten verallgemeinerten Lagrange-Basis {ϕ(r) , r = 1, ..., R} des Polynomraums P (T ) . Wegen der Beschränktheit
der Knotenfunktionale χr folgt
|F (v)| ≤ |v| + |IT v| ≤ |v| +
R
X
r=1
|χr (v)| |ϕ(r) | ≤ (1 + Rcb max |ϕ(r) |) kvkm;T ,
r=1,...,R
und damit die Beschränktheit von F (·) . Wegen IT q = q für q ∈ P (T ) gilt weiter
F (q) = 0,
q ∈ Pm (T ).
Aus Satz 3.5 folgt damit die behauptete Abschätzung.
Q.E.D.
Beispiele von Halbnormen, für die das obige Resultat angewendet wird, sind etwa:
1. L2 -Norm über T :
|v − IT v| :=
Z
T
|v − IT v|2 dx
1/2
.
104
2. L2 -Norm über den Rand ∂T :
|v − IT v| :=
Z
∂T
|v − IT v|2 dx
1/2
.
3. Mittelwert über eine Kante Γ ⊂ ∂T :
Z
|v − IT v| := (v − IT v) dx .
Γ
4. Maximum-Norm über T :
|v − IT v| := max |v − IT v|.
T
5. Wert in einem Punkt P ∈ Ω :
|v − IT v| := |(v − IT v)(P )|.
Als nächstes greifen wir nun unser eigentliches Problem an, nämlich den Interpolationsfehler
auf den einzelnen Zellen T der Zerlegung Th abzuschätzen. Wir tun dies für den representativen
Spezialfall der klassischen Lagrange/Hermite-Interpolation, bei der die Knotenfunktionale χr
als Punktfunktionale für Funktionswerte sowie Ableitungswerte in gewissen Knotenpunkten âr ∈
T̂ (r = 1, ..., R) gegeben sind.
Sei T̂ das Referenzelement der Größe ĥ := diam(T̂ ) = 1 und Inkreisradius ρ̂ > 0 . Für eine
einzelne Zelle T ∈ Th bezeichnen wir mit ar = Bâr + b die aus den Stützstellen âr ∈ T̂ durch
Anwendung der Transformation σ(x̂) = B x̂ + b erzeugten Punkte ar ∈ T . Entsprechend seien
hT := diam(T ) sowie ρT > 0 der Inkreisradius von T . Die Umkehrabbildung σ −1 : T → T̂
(−1)
hat die Darstellung σ −1 (x) = B −1 x − B −1 b mit der inversen Matrix B −1 = (bij )di,j=1 . Unter
Verwendung dieser Abbildung x = σ(x̂) werden für Funktionen v : T → R und ŵ : T̂ → R
zugehörige Funktionen v̂ : T̂ → R und w : T → R definiert durch
v̂(x̂) := v(x),
w(x) := ŵ(x̂).
(3.3.66)
Entsprechend lassen sich die partiellen Ableitungen nach x̂ und x durch die jeweils anderen
ausdrücken:
d
d
X
X
(−1)
bij ∂ˆj .
bij ∂j , ∂i :=
∂î :=
j=1
j=1
Wir nehmen an, daß der Polynomansatz P̂ (T̂ ) unisolvent ist mit einem Satz von Knotenfunktionalen der Form D̂r v̂(âr ), r = 1, ..., R , wobei die Punkte âr auch mehrfach auftreten können und
r
die Ableitungsoperatoren die Gestalt D̂r = ∂ˆα mit geeigneten Multiindizes αr = (αri , ..., αrd )
haben. Der Ansatzraum P̂ (T̂ ) habe die Lagrange-Basis {ϕ̂r , r = 1, . . . , R} , d.h.:
D̂r ϕˆs (âr ) = δrs .
Wir nehmen weiter an, daß alle auftretenden Ableitungen D̂r auf H m (T̂ ) wohl definiert und
stetig sind:
|D̂r v̂(âr )| ≤ c kv̂km;T̂ , v̂ ∈ H m (T̂ ).
Die lokalen Polynomräume P (T ) werden wieder erzeugt via Koordinatentransformation aus
105
dem Ansatzraum P̂ (T̂ ) auf dem Referenzelement:
P (T ) := {q : T → R| q(σ(·)) ∈ P̂ (T̂ )}.
Dasselbe gilt für die zugehörigen Basen {ϕ(r) , r = 1, ..., R} von P (T )
ϕr (x) := ϕ̂r (σ −1 (x)) ,
x ∈ T.
Für Funktionen v ∈ H m (Ω) erhält man dann durch Setzung
IT v :=
R
X
s=1
D̂s v̂(âs )ϕs ∈ P (T )
eine zellweise Lagrange/Hermite-Interpolierende IT v ∈ P (T ) mit den Eigenschaften (Man beachte D̂r ϕ̂s (âr ) = δrs .):
D̂r IT v(ar ) =
R
X
D̂s v̂(âs )D̂r ϕs (ar ) =
s=1
R
X
D̂s v̂(âs )D̂r ϕ̂s (âr )
s=1
= D̂r v̂(âr ) = D̂r v(ar ),
r = 1, ..., R.
Je nach Art der Ableitungsoperatoren D̂r läßt sich dies gegebenenfalls auch als eine Interpolation mit lokal auf den Einzelzellen T definierten Ableitungsoperatoren Dr bzgl. der (physikalischen) Variablen x ausdrücken; z.B. in den einfachsten Fällen Dr v(ar ) := v(ar ) bzw.
Dr v(ar ) ≈ ∇v(ar ) .
Wir beweisen nun den Hauptsatz dieses Abschnittes zur Lagrange/Hermite-Interpolation.
Satz 3.6 (Spez. Interpolationssatz): Für jedes v ∈ H m (T ) und die zugehörige LagrangeHermite-Interpolierende IT v ∈ P (T ) auf der Zelle T ∈ Th gilt:
|v − IT v|k;T ≤ cI
hm
T
|v|m;T ,
ρkT
0 ≤ k ≤ m,
(3.3.67)
mit Durchmesser und Inkreisradius hT bzw. ρT von T und einer Konstante cI = cI (d, m, T̂ ) .
Beweis: (i) Für eine Funktion f ∈ L1 (T ) bezeichnet fˆ ∈ L1 (T̂ ) die zugehörige Transformierte
fˆ(x̂) := f (x),
x̂ = σ −1 (x) = B −1 x − B −1 b ∈ T̂ .
Die Transformation σ −1 hat die Funktionalmatrix ∇σ −1 = B −1 , so daß gilt:
Z
Z
Z
f (x) dx .
fˆ(x̂) dx̂ = | det B −1 | fˆ(σ −1 (x)) dx = | det B|−1
T̂
T
(3.3.68)
(3.3.69)
T
(−1)
Wir schätzen nun die Elemente bij sowie bij
der Matrizen B und B −1 ab. Jedes x ∈ Rd
mit |x| = ρ gestattet mit zwei Punkten ξ, η ∈ T die Darstellung x = ξ − η, wobei ξ etwa
als Mittelpunkt der Inkugel von T gewählt werden kann. Dann sind ξ̂ = B −1 ξ − B −1 b, η̂ =
B −1 η − B −1 b ∈ T̂ , und wir erhalten
|B −1 x| = |B −1 ξ − B −1 b − B −1 η + B −1 b| = |ξ̂ − η̂| ≤ ĥ.
(3.3.70)
106
Da alle Matrizennormen auf Rd×d äquivalent sind, gilt mit einer Konstante c = c(d)
max
(−1)
i,j=1,...,d
|bij
| ≤ c sup
x∈Rd
|B −1 x|
|B −1 x|
ĥ
= c sup
≤c .
|x|
|x|
ρ
|x|=ρ
(3.3.71)
Analog wird bewiesen:
max
i,j=1,...,d
|bij | ≤ c
h
.
ρ̂
(3.3.72)
(ii) Es seien nun T ∈ Th sowie v ∈ H m (T ) beliebig gegeben. Es ist IT v ∈ P (T ) die Interpolierende von v auf T und
IT̂ v̂(·) = IT v(σ(·)) ∈ P (T̂ )
(3.3.73)
die Interpolierende der Transformierten v̂ ∈ H m (T̂ ) auf T̂ . Nach Satz 3.1 gilt auf T̂ :
|v̂ − IT̂ v̂|k;T̂ ≤ ĉ |v̂|m;T̂ ,
0 ≤ k ≤ m,
(3.3.74)
mit einer festen Konstante ĉ = ĉ(d, m, T̂ ) . Durch Koordinatentransformation zwischen T̂ und
T werden wir nun zeigen, daß
|v − IT v|k;T ≤
c
| det B|1/2 |v̂ − IT̂ v̂|k;T̂ ,
ρk
|v̂|m;T̂ ≤ c hm | det B|−1/2 |v|m;T ,
mit Konstanten c = c(d, m, T̂ ). Diese beiden Beziehungen ergeben dann zusammen mit (3.3.74)
die Behauptung.
(iii) Für die Ableitungen von v bzw. v̂ gilt mit x̂ = σ −1 (x) = B −1 x − B −1 b :
−1
∂c
i v(x̂) = ∂i v(x) = ∂i v̂(σ (x)) =
∂î v̂(x̂) = ∂î v(σ(x̂)) =
d
X
d
X
∂ˆj v̂(x̂) ∂i σj−1 (x) =
d
X
j=1
j=1
∂j v(x) ∂î σj (x̂) =
d
X
∂j v(x)bji =
d
X
j=1
j=1
j=1
(−1)
∂ˆj v̂(x̂) bji ,
und folglich
|∂c
i v(x̂)| ≤ c
ĥ
max |∂ˆj v̂(x̂)|
ρ j=1,...,d
|∂î v̂(x̂)| ≤ c
d
∂j v(x̂)bji ,
h
max |d
∂j v(x̂)|.
ρ̂ j=1,...,d
Für allgemeine Ableitungen Dα bzw. D̂α der Ordnung k = |α| gewinnen wir durch k-malige
Anwendung dieser Beziehungen:
α v(x̂)| ≤ c
d
|D
|D̂ α v̂(x̂)| ≤ c
(−1) |α|
|bij
max
d
β v(x̂)| ≤ c
|bij ||α| max |D
i,j=1,...,d
i,j=1,...,d
|
max |D̂ β v̂(x̂)| ≤ c
max
|β|=|α|
|β|=|α|
ĥ |α|
ρ
h |α|
ρ̂
max |D̂β v̂(x̂)|,
|β|=|α|
d
β v(x̂)| .
max |D
|β|=|α|
107
Mit Hilfe dieser Abschätzungen und der Substitutionsformel (3.3.69) folgt nun
Z
Z
α
2
α v(x̂)|2 dx̂
d
|D v(x)| dx = | det B| |D
T
T̂
Z
ĥ 2|α|
≤ c | det B|
max
|D̂ β v̂(x̂)|2 dx̂
ρ
|β|=|α| T̂
Z
Z
h 2|α|
α
2
d
β v(x̂)|2 dx̂
max
|D
|D̂ v̂(x̂)| dx̂ ≤ c
ρ̂
|β|=|α| T̂
T̂
Z
h 2|α|
|D β v(x)|2 dx .
≤ c | det B|−1
max
ρ̂
|β|=|α| T
Damit ist für 0 ≤ k ≤ m bewiesen:
|v|k;T ≤ c | det B|1/2
ĥ k
ρ
|v̂|k;T̂ ,
|v̂|k;T ≤ c | det B|−1/2
h k
ρ̂
|v|k;T .
Anwendung dieser Beziehungen für v und v − IT v ergibt schließlich wegen 0 < ρ ≤ h ≤ 1 die
behauptete Abschätzungen (3.3.67).
Q.E.D.
Bemerkung 3.6: Die Fehlerabschätzung (3.3.67) für die Polynominterpolation hat natürliche
Verallgemeinerungen auf andere Halbnormen | · |T sowie auf andere Regularitätsstufen v ∈
H m,p (T ) , 1 ≤ p ≤ ∞ . Wir geben ohne Beweis das folgende allgemeine Resultat an:
m−d/p
|v − IT v|k,q;T ≤ ci
hT
k−d/q
ρT
|v|m,p;T ,
(3.3.75)
für 0 ≤ k ≤ m, 1 ≤ p ≤ q ≤ ∞ , mit einer Konstante ci = ci (d, k, m, p, q, Tˆ) . Für spätere
Zwecke sind hiervon insbesondere die Fälle p = q = 1 (für m ≥ 2) , p = q = ∞ sowie
p = 2, q = ∞ (für k ≤ m + 2) von Interesse. Z.B. gilt für d = 2, m = 2, q = ∞, p = 2 :
max |v − IT v| ≤ ci hT |v|2,2;T .
T
(3.3.76)
Auf ähnliche Art wie im Beweis von Satz 3.6 gewinnt man durch Transformation auf das
Einheitselement T̂ die folgende sog. inverse Beziehung“ für finite Elemente:
”
Satz 3.7 (Inverse Beziehung): Unter den obigen Voraussetzungen gilt auf jeder Zelle T ∈
Th für Finite-Elemente-Funktionen v ∈ P (T ) mit einer Konstante c = c(d, ρT , k, s):
|v|k;T ≤ c
hsT
|v|s;T ,
ρkT
0 ≤ s ≤ k ≤ m.
(3.3.77)
Beweis: Für Polynome q̂ ∈ P (T̂ ) gilt wegen der Äquivalenz von Normen auf dem (endlich
dimensionalen) Quotientenraum P (T )/Pk−1 (T ) mit einer Konstante ĉ = ĉ(d, m, T̂ ) :
|q̂|k;T̂ ≤ ĉ |q̂|s;T̂ ,
0 ≤ s ≤ k ≤ m.
Die Behauptung ergibt sich nun wieder durch Transformation auf die Zelle T .
(3.3.78)
Q.E.D.
108
Bemerkung 3.7: Analoge Abschätzungen wie die in Satz 3.6 und Satz 3.7 gelten auch für
Tensorprodukt-Polynomansätze auf Vierecken bzw. Hexaedern.
Wir wollen diese Resultate auf die obigen konkreten Beispiele anwenden. In diesen sind alle
formulierten Bedingungen erfüllt. Insbesondere gilt die uniform shape“ Bedingung
”
hT
sup max
≤ c.
T
∈T
h ρT
h>0
(m−1)
Dann folgt aus Satz 3.6 für die FE-Ansatzräume Vh
die Interpolationsfehlerabschätzungen
|v|m;T ,
|v − IT v|k;T ≤ c hm−k
T
⊂ H01 (Ω) vom Polynomgrad m−1 ∈ N0
k = 0, ..., m, T ∈ Th ,
(3.3.79)
mit Konstanten c = c(d, m, T̂ ). Manchmal möchte man den Interpolationsfehler auch über den
Rand der Zelle oder punktweise abschätzen. Hierfür gilt
m−1/2
k∇2 vkm;T ,
(3.3.80)
k∇2 vkm;T .
max |v − IT v| ≤ chm−1
T
(3.3.81)
kv − IT vk∂T ≤ chT
und z.B. in zwei Dimensionen
x∈T
Als Folgerung aus diesem lokalen Abschätzungen erhalten wir die folgenden globale Approximationsabschätzungen
|v − Ih v|k ≤ c hm−k |v|m ,
k = 0, ..., m.
(3.3.82)
ku − Ih uk + hk∇(u − Ih u)k ≤ ch2 k∇2 uk.
(3.3.83)
Für lineare“ finite Elemente gilt also speziell
”
In diesem Fall ergibt die inverse“ Beziehung (3.3.77):
”
k∇vh k ≤ h−1 kvh k,
(1)
vh ∈ Vh .
(3.3.84)
Entsprechend gilt für quadratische“ finite Elemente
”
ku − Ih uk + hk∇(u − Ih u)k ≤ ch3 k∇3 uk,
(3.3.85)
und
k∇2 vh k ≤ h−2 kvh k,
(2)
vh ∈ Vh .
(3.3.86)
Damit ist jetzt die theoretische Grundlage für die a priori Fehlerabschätzungen für das GalerkinFinite-Elemente-Verfahren aus Satz 3.1 geschaffen.
3.4 A priori Fehleranalyse
109
Die in Abschnitt 3.3 hergeleiteten Abschätzungen für den Fehler bei der Interpolation mit
stückweise polynomialen Funktionen sind die Basis für die a priori Fehleranalyse des FiniteElemente-Verfahrens. Wir formulieren die folgende Verallgemeinerung von Satz 3.1 für FEApproximationen allgemeiner Ordnung m ≥ 2 ,
(∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh ,
(3.4.87)
der Poisson-Gleichung. Dabei ist die sog. Ordnung“ eines FE-Verfahrens im wesentlichen durch
”
den Polynomgrad der verwendeten Ansatzfunktionen bestimmt, d.h. durch die Beziehung Pm−1 ⊂
P (T ) für alle T ∈ Th .
Korollar 3.2 (Allg. FE-Konvergenz): Für den Fehler eh := u−uh einer FE-Methode mit
Ansatzräumen Vh ⊂ H01 (Ω) der Ordnung m ≥ 2 zur Approximation der Poisson-Gleichung gilt
die a priori Fehlerabschätzung:
keh k + hk∇eh k ≤ c hm k∇m uk .
(3.4.88)
Wir wollen eine Schwäche dieses Resultats nicht unerwähnt lassen. Im allgemeinen sind Lösungen u ∈ H01 (Ω) elliptischer Gleichungen zweiter Ordnung über Gebieten mit Polygonrand nicht
aus H m (Ω) für m ≥ 3. An den Ecken von ∂Ω treten starke Singularitäten der Ableitungen von
u auf. Die obige Voraussetzung u ∈ H m (Ω) ist also für m > 2 unrealistisch. Finite Elemente
höherer Ordnung m > 2 können jedoch bei Gebieten mit hinreichend glattem Rand ∂Ω erfolgreich verwendet werden, denn in diesem Fall kann die Regularitätstheorie meist u ∈ H m (Ω)
sichern. Dabei sind aber besondere Maßnahmen, wie z. B. die Verwendung isoparametrischer
Ansätze, zur Approximation entlang des krummen Randes erforderlich.
Wir haben gesehen, daß der Fehler z.B. bei linearen“ finiten Elementen gemessen in der L2 ”
Norm eine verbesserte Konvergenzordnung O(h2 ) gegenüber der von O(h) in der Energie-Norm
zuläßt. Es stellt sich die Frage, ob man durch weitere Abschwächung der Norm vielleicht noch
höhere Konvergenzordnungen erzielen kann. Diese Hoffnung wird zunächst bestärkt durch die
Beobachtung, daß dies für die L2 -Projektion durchaus der Fall ist. Die in Frage kommenden Normen werden illustrativ als negative“ Sobolew-Normen bezeichnet und sind in den einfachsten
”
Fällen definiert durch
kvk−1 := sup
ϕ∈V
(v, ϕ)
,
kϕk1
kvk−2 :=
sup
ϕ∈V
∩H 2 (Ω)
(v, ϕ)
.
kϕk2
wobei wieder V := H01 (Ω) .
(1)
Hilfssatz 3.6 (L2 -Projektion): Für die L2 -Projektion Ph : V → Vh auf den Raum Vh
linearen“ finiten Elemente gilt die Fehlerabschätzungen
”
ku − Ph uk−2 + hku − Ph uk−1 + h2 ku − Ph uk ≤ ch4 k∇2 uk .
der
(3.4.89)
Beweis: Zunächst rekapitulieren wir die übliche Bestapproximationseigenschaft“ der L2 -Projektion:
”
ku − Ph uk = min ku − ϕh k .
(1)
ϕh ∈Vh
(3.4.90)
110
Daraus folgt mit der lokalen Interpolationsabschätzung (3.3.79) die Beziehung
ku − Ph uk ≤ ch2 k∇2 uk .
(3.4.91)
Mit einem beliebigen ϕ ∈ H01 (Ω) gilt entsprechend für k ∈ {1, 2} :
(u − Ph u, ϕ) = (u − Ph u, ϕ − Ph ϕ)
≤ ku − Ph uk kϕ − Ph ϕk
≤ ch2+k k∇2 uk k∇k ϕk .
Dies impliziert
(u − Ph , ϕ)
≤ ch2+k k∇2 uk ,
kϕk
k
ϕ∈H 1 (Ω)∩H k (Ω)
sup
0
Q.E.D.
Der Beweis von Hilfssatz 3.6 zeigt, daß eine weitere Erhöhung jenseits O(h4 ) der Approximati(1)
onsordnung der L2 -Projektion auf den Ansatzraum Vh auch in einer noch schwächeren Norm
(1)
nicht mehr möglich ist. Für die Ritz-Projektion“ Rh : V → Vh ist in diesem Fall sogar O(h2 )
”
die Obergrenze für die erreichbare Ordnung. Dies zeigt der folgende Satz.
(1)
Satz 3.8 (Ritz-Projektion): Für die Ritz-Projektion Rh : V → Vh
linearen“ finiten Elemente gilt die Abschätzung
”
ku − Rh uk−1 ≥ c(f ) k∇(u − Rh u)k2 ,
auf den Raum der
(3.4.92)
mit einer positiven Konstante c(f ) > 0 .
Beweis: Sei f ∈ H01 (Ω) . Für die Lösung u ∈ V der Gleichung −∆u = f gilt unter Ausnutzung
der Galerkin-Orthogonalität“:
”
(u − Rh u, f ) = (∇(u − Rh u), ∇u) = k∇(u − Rh u)k2 .
Wegen
sup
ϕ∈V
(u − Rh u, ϕ)
(u − Rh u, f )
≥
kϕk1
kf k1
impliziert dies die Behauptung.
Q.E.D.
Da die Energie-Fehlerabschätzung
k∇(u − Rh u)k ≤ ch k∇2 uk
bzgl. der Ordnung bestmöglich ist, folgt aus (3.4.92) die Unmöglichkeit einer Fehlerabschätzung
mit einer Ordnung größer als zwei für lineare“ finite Elemente.
”
3.4.1 Punktweise Fehlerabschätzung
In den vorangegangenen Abschnitten haben wir gesehen, daß die Methode der finiten Elemente
als Projektionsmethode zunächst ganz natürlich zu a priori Abschätzungen in der Energienorm“
”
111
k∇ek und dann über ein Dualitätsargument auch zu verbesserten Abschätzungen in der L2 Norm kek führt. Diese Konvergenzaussagen im quadratischen Mittel“ gestatten aber noch
”
keinen unmittelbaren Schluß auf die punktweise Konvergenz des Verfahrens. Dieser Frage soll
jetzt wieder anhand des einfachen Modellproblems Poisson-Gleichung“,
”
−∆u = f in Ω,
u = 0 auf ∂Ω,
(3.4.93)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 nachgegangen werden. Wir beschränken uns da(1)
bei auf die Approximation (3.4.87) mit stückweise linearen Ansätzen Vh ⊂ V auf regulären
Triangulierungen. Wir rekapitulieren hierfür die a priori Fehlerabschätzung
kek + hk∇ek ≤ ch2 k∇2 uk ,
(3.4.94)
wobei die Konstante c wesentlich durch die Konstante in der Interpolationsfehlerabschätzung
k∇(u − Ih u)kT ≤ ci h k∇2 ukT ,
T ∈ Th ,
(3.4.95)
bestimmt ist. Wir erinnern daran, daß im vorliegenden Fall eines konvexen Grundgebiets jedes
v ∈ V mit ∆v ∈ L2 (Ω) automatisch in H 2 (Ω) ist und der a priori Abschätzung genügt:
k∇2 vk ≤ k∆vk.
(3.4.96)
Satz 3.9 (Sub-optimale L∞ -Norm-Fehlerabschätzung): Unter den obigen Voraussetzungen konvergiert die Methode der finiten Elemente punktweise mit der Ordnung O(h) :
max |e| ≤ chk∇2 uk .
(3.4.97)
Ω
(1)
Beweis: Sei T ein beliebiges Dreieck aus Th . Für eine Funktion vh ∈ Vh
Z
−1
max |vh | ≤ c|T |
|vh | dx.
T
gilt dann
(3.4.98)
T
Dies folgt leicht mit Hilfe der Transformation auf die Referenzzelle T̂ ( dx ≈ |T |dx̂ ) und der
dort geltenden Beziehung (Äquivalenz von Normen)
Z
max |v̂h | ≤ ĉ |v̂h | dx̂.
T̂
T̂
(1)
Mit der Knoteninterpolierenden Ih u ∈ Vh
zu u ∈ V ∩ H 2 (Ω) gilt
max |u − Ih u| ≤ chT k∇2 ukT .
T
Damit erschließen wir dann
max |e| ≤ max |u − Ih u| + max |Ih e|
T
T
T
Z
≤ max |u − Ih u| + c|T |−1
|Ih e| dx
T
T
Z
−1
≤ max |u − Ih u| + c|T |
|e| dx ≤ chT k∇2 ukT + ch−1
T kekT .
T
T
(3.4.99)
112
Mit Hilfe der L2 -Fehlerabschätzung (3.4.94) folgt also die Behauptung.
Q.E.D.
Bemerkung 3.8: Unter der bloßen Annahme u ∈ V ∩H 2 (Ω) ist die Fehlerabschätzung (3.4.97)
bzgl. der h-Potenz optimal. Um dies einzusehen, betrachte man z.B. auf dem Einheitskreis
B1 = {x ∈ R2 | |x| < 1} die Funktionen
uh (x) := (|x|2 + h4 )1/2
Offenbar ist uh ∈ H 2 (B1 ) , und es gilt
Z
1/2
k∇2 uh kB1 ≤ c
(|x|2 + h4 )−1 dx
≤ c | ln(h)|1/2 .
B1
Wir nehmen nun an, daß unser Lösungsgebiet Ω den Kreis B1 enthält und die Funktionen
uh geeignet zu Funktionen ūh ∈ H01 (Ω) ∩ H 2 (Ω) fortgesetzt sind. Ferner gehöre zu jeder der
Triangulierungen Th ein Dreieck T0 mit Durchmesser h und dem Inkreismittelpunkt a0 = 0.
Dann ist in den Eckpunkten ai und dem Mittelpunkt a0 von T0 stets
ūh (ai ) ≥ h,
ūh (a0 ) = h2 .
Würde nun für die Ritz-Projektion ūhh ∈ Vh zu ūh mit einem ε > 0 gelten
max |ūh − ūhh | ≤ ch1+ε k∇2 ūh kΩ ,
T0
so ergäbe sich für hinreichend kleines h im Widerspruch zur Linearität der ūhh auf T0 :
|ūhh (a0 )| ≤ |ūhh (a0 ) − ūh (a0 )| + |ūh (a0 )| ≤ ch1+ε1 ,
0 < ε1 < ε,
|ūhh (ai )| ≥ |ūh (ai )| − |ūh (ai ) − ūhh (ai )| ≥ ch.
Numerische Experimente zeigen, daß im Falle höherer Regularität von u (etwa u ∈ C 2 (Ω))
die optimale Ordnung O(h2 ) des L2 -Fehlers auch für die punktweise Konvergenz vorliegt. Ein
ähnliches Phänomen haben wir bereits bei der Differenzenapproximation mit dem 5-PunkteOperator gesehen, bei dem sich auf gleichförmigen Gittern die Konvergenzordnung O(h) im
Falle u ∈ C 3 (Ω) auf O(h2 ) im Falle u ∈ C 4 (Ω) erhöht. Für die Methode der finiten Elemente
beweisen wir nun das folgende optimale Resultat auf allgemeinen regulären Gittern:
Satz 3.10 (Optimale L∞ -Abschätzung): Im Falle u ∈ V ∩ C 2 (Ω) gilt die Konvergenzabschätzung
sup |e| ≤ ch2 {| ln(h)| + 1} max |∇2 u|.
Ω
Ω
(3.4.100)
Beweis: Wir notieren zunächst die Interpolationsfehlerabschätzung
sup |u − Ih u| + h sup |∇(u − Ih u)| ≤ ch2 sup |∇2 u|
Ω
Ω
(3.4.101)
Ω
I) Für ein h > 0 sei T∗ ∈ Th beliebig, aber fest gewählt. O.B.d.A. wird im folgenden h ≤
(1)
angenommen. Mit der Knoteninterpolierenden Ih u ∈ Vh
1
2
von u gilt wieder (siehe Beweis von
113
Satz 3.9)
−1
max |e| ≤ c max |u − Ih u| + c|T∗ |
T∗
T∗
≤
ch2T∗
2
−1
max |∇ u| + c|T∗ |
T∗
Z
T∗
|e| dx
T∗
|e| dx.
Z
Damit ist die Abschätzung des L∞ -Fehlers zurückgeführt auf eine lokale L1 -Fehlerabschätzung.
Mit der durch
δh :≡ |T∗ |−1 sign(e) in T∗ , δh :≡ 0 sonst,
definierten Funktion δh ∈ L2 (Ω) ( regularisierte“ Dirac17 -Funktion) gilt weiter
”
Z
−1
|T∗ |
|e| dx = (δh , e).
T∗
II) Im nächsten Schritt wird wieder ein Dualitätsargument verwendet. Wir betrachten das Hilfsproblem
−∆gh = δh in Ω,
gh = 0 auf ∂Ω.
(3.4.102)
Die Funktion gh kann als regularisierte“ Greensche Funktion angesehen werden. Damit erhalten
”
wir
Z
|e| dx = (∇e, ∇gh ).
(3.4.103)
|T∗ |−1
T∗
Unter Verwendung der durch
(1)
(∇ghh , ∇ϕh ) = (∇gh , ∇ϕh ) ∀ϕh ∈ Vh ,
(1)
definierten Ritz-Projektion“ ghh ∈ Vh von gh erhalten wir durch zweimalige Anwendung der
”
Galerkin-Orthogonalität die Beziehung
Z
−1
(3.4.104)
|e| dx = (∇e, ∇(gh − ghh )) = (∇(u − Ih u), ∇(gh − ghh )).
|T∗ |
T∗
Mit der Hölderschen Ungleichung folgt
Z
Z
−1
|∇(gh − ghh )| dx.
|T∗ |
|e| dx ≤ max |∇(u − Ih u)|
T∗
Ω
(3.4.105)
Ω
Unter Beachtung der Interpolationsabschätzung (3.4.101) erhalten wir schließlich die Beziehung
Z
|∇(gh − ghh )| dx max |∇2 u|.
(3.4.106)
max |e| ≤ ch h +
T∗
Ω
Ω
Die punktweise Abschätzung des Fehlers e ist also zurückgeführt auf eine globale L1 -Fehlerabschätzung für den Gradienten der Greenschen Funktion“: ∇(gh − ghh ) . Dieser wird unten
”
17
Paul Adrien Maurice Dirac (1902-1984): französischer Physiker und Mathematiker; Prof. in Cambridge; wichtige Beiträge zur Quanten Mechanik und Kosmologie, 1933 Nobel-Preis.
114
weiter abgeschätzt. Dazu benötigen wir einige a priori Abschätzungen für gh , die im folgenden
bereitgestellt werden.
III) Sei x∗ der Inkreismittelpunkt von T∗ . Wir definieren die Gewichtsfunktion
σ(x) := (|x − x∗ |2 + κ2 h2 )1/2 .
Durch Nachrechnen verifiziert man leicht die Beziehungen ( 0 < h ≤
κh ≤ σ ≤ c,
|∇σ| ≤ c∗ ,
|∇2 σ| ≤ cσ −1 ,
1
2
)
kσ −1 k ≤ c | ln(h)|1/2 ,
mit von h und κ unabhängigen Konstanten. Für die Größen σ̄T := maxT σ und σ T := minT σ
gilt daher
σ̄T ≤ σ T + h max |∇σ| ≤ σ T + c∗ h,
T
und bei Wahl von κ := 2c∗ (unabhängig von h):
σ̄T ≤ σ T + 12 σ̄T ,
und damit
max
T ∈Th
σ̄T
≤ 2.
σT
(3.4.107)
Hilfssatz 3.7 (Greensche Funktion): Für die regularisierte Greensche Funktion“ gh gel”
ten die a priori Abschätzungen
sup |gh | ≤ c | ln(h)|,
(3.4.108)
Ω
k∇gh k + kσ∇2 gh k ≤ c | ln(h)|1/2 ,
2 h
−1
k∇ g k ≤ ch
,
(3.4.109)
(3.4.110)
mit von h ∈ (0, 12 ] unabhängigen Konstanten c.
Beweis: (i) Die richtige“ Greensche Funktion g(·) = g(x∗ , ·) zum Aufpunkt x∗ erlaubt die
”
Abschätzung (Beweis mit Hilfe des Maximumprinzips)
|g(x)| ≤ c {| ln(|x − x∗ |)| + 1} .
Konstruktionsgemäß folgt damit
|gh (x)| = |(∇gh , ∇g)| = |(δh , g)Ω | ≤ ch−2
Z
T∗
|g| dx ≤ c {| ln(h)| + 1} .
Dies impliziert die Abschätzung (3.4.108).
(ii) Zum Beweis von (3.4.110) verwenden wir die übliche a priori L2 /H 2 -Abschätzung
k∇2 gh k ≤ ckδh k ≤ ch−1 .
(iii) Als nächstes notieren wir die einfache a priori Abschätzung
k∇2 gh k ≤ k∆gh k ≤ ch−1 .
(3.4.111)
115
Weiter gilt
k∇gh k2 = (δh , gh ) ≤ c max |gh | ≤ c | ln(h)|.
Ω
Dies impliziert den ersten Teil der Abschätzung (3.4.109).
(iii) Schließlich setzen wir ξ := x − x∗ und finden wegen
|ξi ∇2 gh | ≤ |∇2 (ξi gh )| + |∇gh |
die Beziehung
kσ∇2 gh k2 =
≤
2
X
i=1
kξi ∇2 gh k2 + κ2 h2 k∇2 gh k2
2 n
X
i=1
o
k∇2 (ξi gh )k2 + k∇gh k2 + κ2 h2 k∇2 gh k2 .
Mit Hilfe der üblichen a priori L2 /H 2 -Abschätzung (3.4.96) folgt
k∇2 (ξi gh )k ≤ k∆(ξi gh )k ≤ kξi ∆gh k + k∇gh k
≤ kξi δh k + k∇gh k ≤ c + c | ln(h)|1/2 .
Die vorausgehenden Abschätzungen implizieren dann
o
n
kσ∇2 gh k ≤ c 1 + | ln(h)|1/2 ,
woraus (3.4.109) folgt. Dies vervollständigt den Beweis von (3.4.109).
Q.E.D.
IV) Wir kehren nun zum Beweis des Satzes zurück und schätzen wie folgt ab:
Z
|∇(gh − ghh )| dx ≤ kσ −1 k kσ∇(gh − ghh )k ≤ c | ln(h)|1/2 kσ∇(gh − ghh )k.
Ω
Durch Ausdifferenzieren folgt weiter
kσ∇(gh − ghh )k2 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ))) − (∇(gh − ghh ), (gh − ghh )∇σ 2 )
=: E1 − E2 .
Die Terme E1 und E2 werden im folgenden separat abgeschätzt. Im Hinblick auf die GalerkinOrthogonalität gilt
E1 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ) − ψh ))
(1)
mit der Knoteninterpolierenden ψh := Ih {∇(σ 2 (gh − ghh ))} ∈ Vh . Dies wird weiter abgeschätzt
durch
X
kσ∇(gh − ghh )kT kσ −1 ∇(σ 2 (gh − ghh ) − ψh )kT
E1 ≤
T ∈Th
≤ 14 kσ∇(gh − ghh )k2 + c
X
T ∈Th
kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T .
116
Mit Hilfe der Interpolationsfehlerabschätzung (3.4.99) werden die einzelnen Summanden wie
folgt abgeschätzt:
2
2 h
h
kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T ≤ σ −2
T k∇(σ (g − gh ) − ψh )kT
Dies ergibt wegen (3.4.107):
E1 ≤
h
1
4 kσ∇(g
2
2 2 h
h
2
≤ c σ −2
T hT k∇ (σ (g − gh ))kT
2
h
h 2
h
h 2
2 2 h 2
≤ c σ −2
T hT kg − gh kT + kσ∇(g − gh )kT + kσ ∇ g kT
2 2
2 h 2
h
h 2
≤ c kgh − ghh k2T + c σ −2
T σ̄T hT k∇(g − gh )kT + kσ∇ g kT .
− ghh )k2 + c kgh − ghh k2 + c h2 k∇(gh − ghh )k2 + kσ∇2 gh k2 .
Die schon bekannten L2 -Fehlerabschätzungen liefern weiter
E1 ≤ 41 kσ∇(gh − ghh )k2 + ch2 h2 k∇2 gh k2 + kσ∇2 gh k2 ,
sowie unter Beachtung der Abschätzungen von Hilfssatz 3.7
E1 ≤ 14 kσ∇(gh − ghh )k2 + ch2 | ln(h)|.
Für den zweiten Term gilt wegen |∇σ 2 | ≤ cσ :
E2 ≤ ckσ∇(gh − ghh )kkgh − ghh k ≤ 14 kσ∇(gh − ghh )k2 + ckgh − ghh k2
sowie mit den Argumenten von eben:
E2 ≤ 41 kσ∇(gh − ghh )k2 + ch2 .
Kombination der Abschätungen für E1 und E2 ergibt schließlich
kσ∇(gh − ghh )k2 ≤ 12 kσ∇(gh − ghh )k2 + ch2 | ln(h)|,
und damit die Behauptung.
Q.E.D.
Der logarithmische Term | ln(h)| in der Abschätzung (3.4.100) läßt sich auf allgemeinen Gittern nicht vermeiden. Dies wird durch numerische Tests und auch durch theoretische Analyse
bestätigt. Auf gleichförmigen Gittern (Je zwei benachbarte Dreiecke bilden ein Parallelogramm.)
erhält man unter der stärkeren Glattheitsbedingung u ∈ C 2+α (Ω) allerdings die optimale Konvergenzordnung O(h2 ). Vergleicht man dieses Resultat mit dem entsprechenden für die Differenzenapproximation mit dem 5-Punkte-Operator, so stellen wir eine deutliche Abschwächung
der Regularitätsanforderungen um fast zwei Stufen fest.
Auf Polygongebieten ist die Bedingung u ∈ H 2,∞ (Ω) für die schwache Lösung von (3.4.93)
im allgemeinen unrealistisch. Bei den Ecken können die zweiten Ableitungen Singularitäten
haben. Auf konvexen Polygongebieten ist gerade die Voraussetzung u ∈ H 2 (Ω) natürlich, d.h.
stets erfüllt, wogegen u ∈ H 2,∞ (Ω1 ) nur auf Teilgebieten Ω′1 ⊂ Ω mit positivem Abstand zu
den Eckpunkten gilt. In diesem Fall haben wir das folgende lokale“ Resultat:
”
Satz 3.11 (Lokales Fehlerverhalten): Sei Ω1 ⊂ Ω ein Teilgebiet mit positivem Abstand δ1
zu den Eckpunkten von Ω und u ∈ H 2 (Ω) ∩ C 2 (Ω1 ). Dann gilt auf jedem zweiten Teilgebiet
117
Ω2 ⊂ Ω1 mit Abstand δ2 > δ1 zu den Eckpunkten die Fehlerabschätzung
2
2
2
sup |e| ≤ ch | ln(h)| sup |∇ u| + k∇ ukΩ .
Ω2
(3.4.112)
Ω1
Beweis: Der technisch aufwendige Beweis kann im Rahmen dieser Vorlesung nicht geführt
werden.
Q.E.D.
Bemerkung 3.9: Zum Abschluß bemerken wir noch, daß sich für finite Elemente höherer Ordnung (Polynomgrad m − 1 ≥ 2) zu (3.4.100) analoge punktweise Fehlerabschätzungen unter der
Voraussetzung u ∈ C m (Ω) herleiten lassen:
sup |e| ≤ chm sup |∇m u|.
Ω
(3.4.113)
Ω
Bemerkenswerterweise tritt dabei ab Polynomordnung m − 1 = 2 der störende logarithmische
Term | ln(h)| nicht auf. Dasselbe gilt auch für den niedrigsten Ansatzgrad m − 1 = 1 , wenn der
maximale Fehlergradient betrachtet wird:
sup |∇e| ≤ ch sup |∇2 u|.
Ω
Ω
(3.4.114)
118
3.5 Implementierungsaspekte
Im folgenden wollen wir einige Fragen im Zusammenhang mit der praktischen Realisierung von
Finite-Elemente-Methoden diskutieren. Dazu betrachten wir als Modellfall die 1. RWA eines
allgemeineren (elliptischen) Differentialoperators,
Lu := −∇{a∇u} = f
in Ω,
u = 0 auf ∂Ω,
(3.5.115)
mit möglicherweise variablem Koeffizienten a = a(x) ≥ α > 0 auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Die Diskretisierung erfolgt wieder auf Ansatzräumen Vh ⊂ H01 (Ω) zu einer Folge
von (gleichmäßig) regulären Zerlegungen Th = {T } des Grundgebiets Ω ⊂ Rd (d = 2, 3),
a(u, ϕ) = l(ϕ)
∀ϕh ∈ Vh .
(3.5.116)
mit den bilinearen bzw. linearen Formen
a(u, ϕ) := (a∇uh , ∇ϕh ),
l(ϕ) := (f, ϕh ).
Die Aufstellung des zugehörigen linearen Gleichungssystems erfordert in der Regel die Anwendung numerischer Integration, was zu einem zusätzlichen Fehler führt.
3.5.1 Aufbau der Systemmatrizen und Vektoren
Im Gegensatz zu den Differenzenverfahren auf strukturierten Gittern lassen sich die algebraischen Gleichungssysteme der Finite-Elemente-Verfahren auf allgemeinen Zerlegungen Th in der
Regel nicht explizit per Hand“ aufstellen.
”
(n)
Mit der Knotenbasis {ϕh , n = 1, ..., N } des Finite-Elemente-Raumes Vh ⊂ H01 (Ω) sind
N
die Systemmatrizen A = (anm )N
n,m=1 (”Steifigkeitsmatrix“) und M = (mnm )n,m=1 (”MassenN
matrix“) sowie der Lastvektor“ b = (bn )n=1 gebildet gemäß
”
(m)
(n)
anm = a(ϕh , ϕh ),
(m)
(n)
mnm = (ϕh , ϕh ),
(n)
bn = l(ϕh ).
Beide Matrizen sind konstruktionsgemäß symmetrisch und positiv-definit. Ihre größten und
kleinsten Eigenwerte seien λmax (A) , λmin (A) bzw. λmax (M ) , λmin (M ) , und die zugehörigen
Spektralkonditionen:
λmax (M )
λmax (A)
, κ2 (M ) =
.
κ2 (A) =
λmin (A)
λmin (M )
Wir rekapitulieren die folgenden Beziehungen zwischen einer Finite-Elemente-Funktion vh ∈ Vh
N
und ihrem zugehörigen Knotenvektor ξ = (ξn )N
n=1 ∈ R :
vh =
N
X
n=1
(n)
ξn ϕh ,
kvh k2 = hM ξ, ξi,
a(vh , vh ) = hAξ, ξi,
wobei h·, ·i das euklidische Skalarprodukt bezeichnet; die euklidische Vektornorm ist | · | . Der
Knotenvektor ξ ist bestimmt durch das lineare Gleichungssystem
Aξ = b
(3.5.117)
119
Zur Aufstellung des Systems (3.5.117) bedient man sich in der Praxis eines zell-orientierten
Prozesses, des sog. Assemblierens“ (englischen assembling“). Dabei wird das Konzept der
”
”
Element-(Last)-Vektoren“ und Element-(Steifigkeits)-Matrizen” verwendet. Für einen Kno”
”
T )T mit
tenvektor ξ ∈ RN und eine Zelle T ∈ Th ist dabei ξT = (ξ1T , ..., ξnT , ..., ξN
ξnT := ξn
(n)
falls ϕh 6≡ 0 auf T, ξnT := 0
(n)
falls ϕh ≡ 0 auf T.
Die zugehörigen Element-Matrizen und -Vektoren haben die Form
(m)
(n) N
AT = (aTnm )N
n,m=1 := (a∇ϕh , ∇ϕh )T n,m=1 ,
(m)
(n) N
MT = (mTnm )N
n,m=1 := (ϕh , ϕh )T n,m=1 ,
(n) N
bT = (bTn )N
n=1 := (f, ϕh )T n=1 .
Dabei werden natürlich nur die wesentlichen, von Null verschiedenen Elemente von AT , MT
und bT gespeichert. Die einzelnen Gesamtmatrizen und Vektoren werden dann gebildet durch
Assemblierung der entsprechenden Element-Matrizen und -Vektoren gemäß :
X
X
X
A=
AT , M =
MT , b =
bT .
T ∈Th
T ∈Th
T ∈Th
Entsprechend gilt
hAξ, ξi =
X
T ∈Th
hAT ξT , ξT i,
hM ξ, ξi =
X
T ∈Th
hMT ξT , ξT i.
Die Element-Beiträge werden in der Regel durch Transformation auf ein Referenzelement berechnet. Wir diskutieren hier nur den Fall von Dreieckszerlegungen. Sei also wieder σT : T̂ → T
die affin-lineare Abbildung des Einheitsdreiecks T̂ auf das Dreieck T :
x = σT (x̂) = BT x̂ + bT ,
x̂ = σT−1 (x) = BT−1 x − BT−1 bT .
Die charakteristischen Parameter von T sowie T̂ sind mit hT , ρT bzw. ĥ, ρ̂ bezeichnet. Für
transformierte Funktionen v̂(x̂) = v(x) gilt dann
Z
Z
v(x) dx = | det BT |
v̂(x̂) dx̂,
T
T̂
woraus insbesondere | det BT | = |T ||T̂ |−1 ≈ hdT folgt. Ferner ist mit der Inversen BT−1 =
(−1)
(bij )dij=1 :
d
d
X
X
(−1)
ˆ
∂ˆj v̂(x̂)b
.
∂
v̂(x̂)∂
x̂
=
∂c
v(x̂)
=
∂
v(x)
=
∂
v̂(x̂)
=
j
i j
i
i
i
ji
j=1
j=1
c
ˆ
bzw. ∇v(x̂)
= BT−T ∇v̂(x̂)
. Die Elemente der Element-Matrizen AT und MT sowie des Element-
120
Vektors bT transformieren sich wie folgt:
Z
Z
(m)
(n)
T
d(n) dx̂
d(m) ∇ϕ
a∇ϕh ∇ϕh dx = | det BT | â∇ϕ
anm =
h
h
T̂
T
Z
ˆ ϕ̂(n) dx̂ =: | det BT | âTnm ,
ˆ ϕ̂(m) B −T ∇
= | det BT | âBT−T ∇
T
h
T̂
Z
Z
(m) (n)
(m) (n)
T
ϕh ϕh dx = | det BT | ϕ̂h ϕ̂h dx̂ =: | det BT | m̂nm .
mnm =
Z T̂
ZT
(n)
(n)
T
f ϕh dx = | det BT | fˆϕ̂h dx̂ =: | det BT | b̂n .
bn =
T̂
T
Die Werte âTnm , m̂Tnm und b̂Tn auf der Referenzzelle werden nun mit Hilfe von Quadraturformeln
auf T̂ berechnet. Dazu werden wir weiter unten noch mehr Details angeben. Wichtig ist, daß
diese Quadratur nur auf der Referenzzelle stattfindet und die tatsächlich verwendeten Größen
anm , mnm und bn im wesentlichen durch Skalierung mit | det BT | gewonnen werden.
3.5.2 Konditionierung der Systemmatrix
Wir wollen zunächst die Stabilität (für h → 0 ) der diskreten Finite-Elemente-Gleichung (3.5.117)
gegenüber Störungen der Daten untersuchen. Diese treten z.B. auf durch die Fehler bei der Berechnung der Elemente anm und mnm bei Verwendung von numerischer Quadratur. Durch rein
algebraische Argumente erhalten wir zunächst eine Stabilitätsabschätzung für allgemeine lineare
Gleichungssysteme (siehe Skriptum Einführung in die Numerik“).
”
Satz 3.12 (Allgemeiner Störungssatz): Seien Störungen δA der Matrix A und δb der
rechten Seite b gegeben, so daß µ := κ2 (A)kδAk/kAk < 1 . Dann gilt die Fehlerabschätzung
|δξ|
κ2 (A) n kδAk |δb| o
.
≤
+
|ξ|
1 − µ kAk
|b|
(3.5.118)
Zur quantitativen Auswertung dieser Abschätzung müssen wir die Spektralkondition der Steifigkeitsmatrix A in Abhängigkeit von der Gitterweite h abschätzen. Dazu nehmen wir an, daß
die betrachtete Familie von Zerlegungen (Th )h>0 gleichmäßig form- und größen-regulär“ ist,
”
d.h.:
maxT ∈Th hT hT
≤ c,
sup
≤ c.
sup max
h>0 minT ∈Th hT
h>0 T ∈Th ρT
Dann ergibt sich analog zum Differenzenverfahren das folgende allgemeine Resultat.
Satz 3.13 (Konditionierung): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th
gilt für die Spektralkonditionen der (symmetrischen und positiv definiten) Steifigkeitsmatrizen
A und der Massenmatrizen M :
κ2 (A) = O(h−2 ),
κ2 (M ) = O(1)
(h → 0).
Beweis: (i) Für die größten und kleinsten Eigenwerte von M gilt
λmin (M ) = min
ξ∈RN
hM ξ, ξi
hM ξ, ξi
≤ max
= λmax (M ) .
2
N
|ξ|
|ξ|2
ξ∈R
(3.5.119)
121
In der folgenden Argumentation werden wieder die Element-Matrizen MT . Ferner bezeichne
dmin und dmax die kleinste bzw. die größte Anzahl von Zellen, die in einem Knoten der Zerlegung
Th zusammentreffen. Mit dieser Notation ergibt sich:
hM ξ, ξi =
hM ξ, ξi =
X
T ∈Th
X
T ∈Th
hMT ξT , ξT i ≥
hMT ξT , ξT i ≤
min
ξ∈RN , T ∈Th
max
ξ∈RN , T ∈Th
hMT ξT , ξT i X
|ξT |2 ≥ min {λmin (MT )} dmin |ξ|2 ,
T ∈Th
|ξT |2
T ∈Th
hMT ξT , ξT i X
|ξT |2 ≤ max {λmax (MT )} dmax |ξ|2 .
T ∈Th
|ξT |2
T ∈Th
Mit Hilfe der Beziehung | det BT | ≈ hdT ergibt sich mit der (festen) Matrix M̂ := (m̂nm )N
n,m=1 :
λmax (MT ) = | det BT | λmax (M̂ ) ≤ chdT ,
λmin (MT ) = | det BT | λmin (M̂ ) ≥ chdT ,
und folglich κ2 (M ) = O(1) .
(ii) Für die kleinsten und größten Eigenwerte von A gilt:
hAξ, ξi
hM ξ, ξi
min
= min
vh ∈Vh
hM ξ, ξi ξ∈RN |ξ|2
hM ξ, ξi
hAξ, ξi
max
= max
λmax (A) ≤ max
vh ∈Vh
|ξ|2
ξ∈RN hM ξ, ξi ξ∈RN
λmin (A) ≥ min
ξ∈RN
a(vh , vh )
λmin (M ),
kvh k2
a(vh , vh )
λmax (M ).
kvh k2
Wir schätzen weiter ab durch
min
vh ∈Vh
a(vh , vh )
a(v, v)
≥ min
=: λmin (L)
2
2
1
kvh k
v∈H0 (Ω) kvk
mit dem kleinste Eigenwert des Differentialoperators L auf dem Gebiet Ω . Ferner ergibt sich
mit Hilfe der inversen Beziehung“ für Finite-Elemente-Funktionen:
”
X
X
−2
2
2
a(vh , vh ) ≤ kak∞
k∇vh k2T ≤ ckak∞
ρ−2
T kvh kT ≤ ckak∞ max ρT kvh k ,
T ∈Th
T ∈Th
T ∈Th
bzw. λmax (A) ≤ c maxT ∈Th ρ2T λmax (M ) . Wir gewinnen so die Abschätzung
λmin (L)λmin (M ) ≤ λmin (A) ≤ λmax (A) ≤ c max ρ−2
T λmax (M ).
T ∈Th
Also ist κ2 (A) ≤ c maxT ∈Th ρ−2
T , was im Hinblick auf die Gleichförmigkeitsannahmen an die
Zerlegungsfolge den Beweis vervollständigt.
Q.E.D.
Bemerkung 3.10: Wir betonen, daß die Asymptotik O(h−2 ) der Kondition der Steifigkeitsmatrix durch die Ordnung des zugrunde liegenden Differentialoperators L bestimmt ist; sie hat
nichts mit dem Polynomgrad m − 1 des Finite-Elemente-Ansatzes oder der Raumdimension
d zu tun. In der Tat wurde der Beweis von Satz 3.13 allgemein für d ≥ 1 und für beliebigen
Polynomgrad m − 1 ≥ 1 geführt. Die Abhängigkeit von ρ := minT ∈Th ρT kommt über die Verwendung der inversen Beziehung zur Abschätzung von λmax (A) ins Spiel. Dabei ergibt offenbar
jede Ableitungsstufe in der Energieform a(·, ·) genau eine negative ρ-Potenz. Der Exponent
−2 ist also gerade durch die Ordnung des betrachteten Differentialoperators bestimmt. Bei der
Finite-Elemente-Diskretisierung von Differentialoperatoren höherer Ordnung 2r ≥ 2 verhält
122
sich die Kondition der Steifigkeitsmatrix dementsprechend wie κ2 (A) = O(h−2r ) . Zum Beispiel
treten in der Plattenstatik Randwertaufgaben vierter Ordnung (r = 2) mit dem biharmonischen
Operator ∆2 auf. In diesem Fall verhält sich die Kondition der zugehörigen Steifigkeitsmatrix
wie O(h−4 ) . Für eine Gitterweite der Größenordnung h ∼ 10−2 in zwei Dimensionen ergibt
sich damit κ2 (A) ∼ 108 , was Rechnung in mindestens doppelt-genauer Arithmetik nahe legt.
Die Fehlerabschätzung (3.5.118) ist am Extremfall einer Störung des Eigenvektors wmax in
Richtung des Eigenvektors wmin orientiert. Sie erfassen also den ungünstigsten Fehlereinfluß, wie
er in der Praxis kaum auftreten wird. Tatsächlich erweist sich (3.5.118) als viel zu pessimistisch
zur realistischen Erfassung des Einflusses von Datenfehlern bei der Lösung der Finite-ElementeGleichungen Ax = b . Zur Verdeutlichung betrachten wir im folgenden ausschließlich den Fall von
Störungen in der rechten Seite b , welche durch fehlerhafte Auswertung (z.B. durch numerische
Quadratur) der gegebenen rechten Seite f der Differentialgleichung entstehen.
Satz 3.14 (Spezieller Störungssatz): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th gilt die Fehlerabschätzung
κ2 (M ) kf k |δb|
|δξ|
≤
,
|ξ|
λ
kuh k |b|
(3.5.120)
mit dem kleinsten Eigenwert λ der 1. RWA des Differentialoperators L auf Ω .
Beweis: Aus der Identität A δξ = δb folgt |δξ| ≤ kA−1 k |δb| = λmin (A)−1 |δb| . Weiter ist
hAz, zi
hM z, zi
hAz, zi
≥ min
min
2
|z|
|z|2
z∈RN hM z, zi z∈RN
z∈RN
a(vh , vh )
λmin (M ) ≥ λ λmin (M ) ,
= min
vh ∈Vh kvh k2
λmin (A) = min
und somit |δξ| ≤ λ−1 λmin (M )−1 |δb| . Mit Hilfe der Schwarzschen Ungleichung ergibt sich
|b|2 =
N
X
(n)
(f, ϕh )2 = f,
N
X
n=1
n=1
(n)
(n) (f, ϕh )ϕh
Wegen
N
X
(n) (n) (f, ϕh )ϕh .
≤ kf k n=1
N
N
X
X
(n)
(m)
(n)
(m)
(n) (n) 2
(f, ϕh )(f, ϕh )(ϕh , ϕh ) = hM b, bi ≤ λmax (M ) |b|2
(f, ϕh )ϕh =
n=1
n,m=1
folgt dann |b| ≤ λmax (M )1/2 kf k . Ferner gilt wegen hM ξ, ξi ≤ λmax (M )kξk2 :
|ξ| ≥ λmax (M )−1/2 hM ξ, ξi1/2 = λmax (M )−1/2 kuh k .
Wir kombinieren die obigen Beziehungen und erhalten
|δξ|
λmax (M ) |δb| kf k
≤ λ−1
,
|ξ|
λmin (M ) |b| kuh k
Q.E.D.
123
Wir haben in Satz 3.13 gesehen, daß die Massenmatrix M eine gleichmäßig bzgl. h beschränkte Spektralkondition hat κ2 (M ) = O(1) (h → 0) . Ferner folgt aus der Konvergenz des
Verfahrens die Beziehung
kuh k = kuk + O(h) (h → 0).
Damit erhalten wir aus Satz 3.14 die folgende asymptotische Abschätzung für die Fehlerfortpflanzung im Finite-Elemente-Galerkin-Verfahren
|δξ|
|δb|
≤ c(f, u, Ω)
,
|ξ|
|b|
(3.5.121)
mit einer nur von f, u und Ω abhängigen Konstante c(f, u, Ω). Dies besagt, daß die FiniteElemente-Methode stabil ist (für h → 0 ) bzgl. Störungen der rechten Seite f .
3.5.3 Aufstellung der Systemmatrizen mit numerischer Integration
Im folgenden analysieren wir den zusätzlichen Fehler, welcher bei näherungsweiser Berechnung
der Matrix- und Vektorelemente anm und bn mittels numerischer Quadratur entsteht. Im Zuge
der Matrix-Assemblierung müssen Integrale über Gitterzellen T ∈ Th ,
Z
Z
(j)
(j)
(i)
(3.5.122)
f (x)ϕh (x) dx,
a(x)∇ϕh (x)∇ϕh (x) dx,
T
T
(i)
berechnet werden, wobei ϕh (x) die Knotenbasisfunktionen sind. Wenn die Datenfunktionen
a(x), f (x) konstant oder auf der Zelle durch Polynome approximiert sind, so sind Integrale der
Form
Z
xp1 xq2 dx, p, q ∈ N0 ,
T
zu berechnen. Hierfür gibt es z.B. auf Dreiecken explizite Formeln. Sei T ein Dreieck in der
(x, y)-Ebene mit den Eckpunkten (xi , yi ), i = 1, 2, 3 . Ist der Ursprung des Koordinatensystems
im Schwerpunkt von T , d.h. x1 + x2 + x3 = y1 + y2 + y3 = 0 , so gilt z.B.:
Z
1 d(x, y) = |T |,
Z
ZT
y d(x, y) = 0,
x d(x, y) =
T
T
Z
|T | 2
(x1 + x22 + x23 ),
x2 d(x, y) =
12
ZT
|T |
xy d(x, y) =
(x1 y1 + x2 y2 + x3 y3 ),
12
T
Z
|T | 2
y 2 d(x, y) =
(y1 + y22 + y32 ).
12
T
Nicht exakt berechenbare Integrale werden durch numerische Quadratur angenähert. Dazu
dienen sog. Quadraturformeln“, welche analog wie auf 1-dimensionalen Intervallen auch auf
”
2- oder 3-dimensionalen Zellen über einen Interpolationsansatz erzeugt werden. Dies geschieht
zunächst auf der Referenzzelle T̂ und ergibt dann durch Transformation T̂ → T = σT (T̂ ) =
BT x̂ + bT auch Quadraturformeln auf den einzelnen Zellen T ∈ Th . Wir beschreiben diesen
124
Prozess im folgenden nur für Quadratur basierend auf Lagrange-Interpolation.
Auf der Referenzzelle T̂ seien ein Polynomraum P (T̂ ) mit S := dim P (T̂ ) sowie ein Satz
von Stützpunkten {x̂s ∈ T̂ , s = 1, ..., S} gewählt, welche unisolvent sind. Die Stützpunkte x̂s
brauchen nicht mit den Knotenpunkten des Finite-Elemente-Ansatzes übereinzustimmen. Seien
weiter L̂s ∈ P (T̂ ) die zugehörigen Lagrangeschen Basispolynome, welche durch die Eigenschaft
L̂s (x̂r ) = δsr charakterisiert sind. Dies erlaubt wieder die explizite Darstellung des zu einer
stetigen Funktion v̂(x̂) gehörenden Interpolationspolynoms durch
p(x̂) =
S
X
v̂(x̂s )L̂s (x̂).
s=1
Dies führt zu folgendem Ansatz für eine Quadraturformel auf T̂ :
QT̂ (v̂) :=
S
X
ω̂s v̂(x̂s ),
ω̂s :=
Z
L̂s (x̂) dx̂.
(3.5.123)
T̂
s=1
Die Stützpunkte x̂s werden so gewählt, daß Polynome von möglichst hohem Grad durch die
Formel exakt integriert werden. Dabei ist aus Stabilitätsgründen wieder darauf zu achten, daß
die Gewichte ω̂s positiv sind.
Definition 3.6 (Quadraturformel): Eine interpolatorische Quadraturformel der Art (3.5.123)
auf einer Referenzzelle T heißt von der Ordnung r “, wenn durch sie Polynome bis zum Grad
”
r − 1 (und nicht höher) exakt integriert werden. Sie wird zulässig“ für den Polynomansatz
”
P (T ) genannt, wenn ihre Stützstellenmenge reichhaltig genug ist, so daß
q ∈ P (T ) :
∇q(xs ) = 0 (s = 1, ..., S)
⇒
q ≡ konst.
(3.5.124)
Mit den Bezeichnungen
xs := σT (x̂s ),
ωs := | det BT | ω̂s
(s = 1, ..., S),
erhalten wir durch
QT (v) :=
S
X
ωs v(xs ) :=
S
X
s=1
s=1
| det BT |ω̂s v̂(x̂s ) = | det BT | QT̂ (v̂)
(3.5.125)
Quadraturformeln QT (·) auf den einzelnen Zellen T ∈ Th . Die gebräuchlichsten solcher Formeln für Dreiecke sind in Abbildung 3.10 zusammengestellt. Dabei bedienen wir uns der gebräuchlichen Schreibweise mit sog. baryzentrischen Koordinaten“. Für ein d-Simplex T mit
”
Eckpunkten {a0 , ..., ad } besitzt jeder Punkt x ∈ T eine eindeutige Darstellung als konvexe
Linearkombination der Eckpunkte:
x=
d
X
i=0
λi ai ,
0 ≤ λ ≤ 1,
d
X
λi = 1.
i=0
Die Koeffizienten {λ0 , ..., λd } sind dann die baryzentrischen Koordinaten von x im Simplex T .
Zum Beispiel sind {1, 0, ..., 0} die baryzentrischen Koordinaten des Eckpunkts a0 und { 12 , ..., 21 }
125
die des Mittelpunktes zT . Die einfachsten Quadraturformeln auf Dreiecken/Simplizes sind die
Mittelpunktregel“ und die Trapezregel“ (siehe auch Abb. 3.10):
”
”
d
QT (v) := |T |v(zT ),
X
1
QT (v) :=
v(ai ).
|T |
d+1
i=0
Abbildung 3.10: Beispiele von Quadraturformeln auf Dreiecken.
Auf Vierecken bzw. Hexaedern werden sog. Tensorproduktformeln“ verwendet. Diese erhält
”
man ebenfalls über Transformation von der Referenzzelle. Demgemäß lauten auf dem Quadrat/Quader mit Mittelpunkt zT und Eckpunkten {a1 , ..., a2d } die Mittelpunktregel sowie die
126
(Tensorprodukt)-Trapezregel:
2d
X
1
QT (v) := d |T |
v(ai ).
2
QT (v) := |T |v(zT ),
i=0
Zur Erzielung höherer Genauigkeit werden extrapolierte Trapez-Formeln (z.B. TensorproduktSimpson-Regel) oder Tensorprodukt-Gauß-Formeln verwendet, welche ähnlich wie im eindimensionalen Fall konstruiert sind. Ein der gebräuchlichsten Formeln für Quadrate ist die 4-PunktGauß-Formel
4
1X
v(ξi ),
QT (v) :=
4
i=1
mit den Gauß-Punkten
ξ1 = (η− , η− ), ξ2 = (η− , η+ ), ξ3 = (η+ , η− ) und ξ4 (η+ , η+ ), wobei
p
1
η± := 2 (1 ± 1/3) .
Satz 3.15 (Quadraturfehler): Für eine interpolatorische Quadraturformel QT (·) der Ordnung r ≥ d auf einer Zelle T ∈ Th angewendet auf eine Funktion v ∈ W r,1 (T ) gilt
Z
Z
v dx − QT (v) ≤ cq hrT
|∇r v| dx,
(3.5.126)
T
T
mit einer von T und v ∈ H r (T ) unbhängigen Quadraturkonstanten cq > 0 .
Bemerkung 3.11: Die Vorausssetzung r ≥ d in Satz 3.15 dient zur Vereinfachung der Formulierung des Resultats. Wegen der Einbettung W d,1 (T ) ⊂ C(T̄ ) sind für Funktionen v ∈ W r,1 (T )
die für die Anwendung der Quadraturformel erforderlichen Punktwerte wohl definiert. Dies ist
aber auch gerade die richtige“ Regularitätsstufe für die maximale Ausnutzung der Approxima”
tionsgüte der Quadraturformel. Dies ist wichtig für die folgende Untersuchung des Einflusses des
Quadraturfehlers auf den Gesamtfehler. Im Übrigen ist jede der gebräuchlichen Quadraturformeln (z.B. Mittelpunkts- oder Trapezregel) mindestens von der Ordnung r = 2 , so daß in zwei
Dimensionen gar keine Einschränkung besteht. In drei Dimensionanen bedarf der Fall r = 2
eine gesonderte Betrachtung, die obwohl nicht schwer, hier nicht durchgeführt wird.
Beweis: Der Beweis verwendet das Bramble-Hilbert-Lemma 3.5 in Verbindung mit dem Transformationsargument von Satz 3.6. Auf der Referenzzelle T̂ definieren wir das Fehlerfunktional
Z
F (v̂) :=
v̂(x̂) dx̂ − QT̂ (v̂).
T̂
Zur Definition von F (·) benötigen wir Punktwerte von v̂ . Diese sind aufgrund des Sobolewschen
Einbettungssatzes in zwei Dimensionen für v ∈ H 2,1 (Ω) und in drei Dimensionen für v ∈
H 3,1 (Ω) wohl definiert. Es gilt dann
|F (v̂)| ≤ ckv̂kH r,1 .
Ferner ist F (·) offensichtlich sublinear und verschwindet nach Voraussetzung auf Pr−1 . Nach
der L1 -Variante des Bramble-Hilbert-Lemmas gilt dann
ˆ r v̂k 1 .
|F (v̂)| ≤ ck∇
L (T̂ )
127
Sei nun σT wieder die affin-lineare Transformation von T̂ auf die Zelle T . Dann gilt für eine
Funktion v ∈ H r,1 (Ω) und ihre Transformierte v̂(x̂) := v(x), x = σT (x̂) :
Z
v(x) dx − QT (v) = | det BT | |F (v̂)|,
T
sowie
−1 r
r
ˆ r v̂k 1
k∇
L (T̂ ) ≤ c| det BT | hT k∇ vkL1 (T ) .
Kombination der letzten beiden Beziehungen ergibt die Behauptung.
Q.E.D.
Im folgenden werden wir uns auf die Quadratur auf Dreiecken bzw. Simplizes beschränken
und nehmen außerdem an, daß der Polynomansatz ein voller Polynomraum ist: P (T̂ ) = Pm−1 (T̂ ) .
Analoge Resultate gelten auch für die Quadratur auf Vierecken bzw. Hexaedern, doch erfordern
deren Formulierung und Beweis eine aufwendigere Notation.
Die Anwendung von Quadraturformeln zur Berechnung der Zellintegrale (3.5.122) ergibt eine
gestörte Bilinearform und rechte Seite
X
X
ah (u, ϕ) :=
QT (a∇u∇ϕ),
lh (ϕ) :=
QT (f ϕ)
T ∈Th
T ∈Th
sowie zugehörige gestörte Steifigkeitsmatrix- und Lastvektorelemente
X
X
(i)
(j)
(i)
QT (f ϕh ).
QT (a∇ϕh ∇ϕh ),
b̃j :=
ãij :=
T ∈Th
T ∈Th
Statt der exakten Finite-Elemente-Lösung uh ∈ Vh ist dann eine gestörte Approximation ũh ∈
Vh zu bestimmen durch
ah (ũh , ϕh ) = lh (ϕh ) ∀ϕh ∈ Vh .
(3.5.127)
Satz 3.16 (Numerische Integration): Die Quadraturformel auf der Referenzzelle QT̂ (·) sei
zulässig“ für den Finite-Elemente-Ansatz P (T̂ ) und von der Ordnung r ≥ d . Dann besitzen die
”
gestörten Finite-Elemente-Gleichungen (3.5.127) eindeutige Lösungen ũh ∈ Vh . Ist a ∈ C r (Ω) ,
so gilt für das gestörte Finite-Elemente-Verfahren der Ordnung m ≥ 2 die Fehlerabschätzung
ku − ũh k + hk∇(u − ũh )k ≤ c hmin{m,r+3−m} kukH m .
(3.5.128)
Zur Erzielung einer maximalen Konvergenzordnung ist also r ≥ 2m − 3 zu wählen.
Beweis: (i) Koerzitivität: Auf einer Zelle T ∈ Th gilt unter Verwendung der Transformation
T = σT (T̂ ) wegen a ≥ α > 0 :
QT (a|∇vh |2 ) =
S
X
ωs a(xs )|∇vh (xs )|2 ≥ α
s=1
S
X
≥α
s=1
S
X
s=1
ωs |∇vh (xs )|2 = α
S
X
s=1
ˆ h (x̂s )|2
| det BT | ω̂s |BT−1 ∇v̂
ˆ h (x̂s )|2 ≥ αc | det BT |h−2
| det BT | ω̂s kBT k−2 |∇v̂
T
S
X
s=1
ˆ h (x̂s )|2 ,
ω̂s |∇v̂
128
wobei v̂h (x̂) = vh (x), x̂ = σT−1 (x) . Analog gilt
ˆ h k2 ≥ c| det BT |−1 h2T k∇vh k2T .
k∇v̂
T̂
Durch
|||v̂h |||T̂ :=
S
X
s=1
ˆ h (x̂s )|2
ω̂s |∇v̂
1/2
ist auf dem Quotientenraum P (T̂ )/P0 eine Norm definiert. Dazu muß nur noch die Definitheit
ˆ h (x̂s ) = 0 (s = 1, ..., S) , so daß wegen
gezeigt werden. Aus |||v̂h |||T̂ = 0 folgt offenbar ∇v̂
der vorausgesetzten Zulässigkeit“ der Quadraturformel notwendig v̂h ≡ konst. ist. Da auch
ˆ h k auf P (T̂ )/P”0 eine Norm ist, gilt wegen der Äquivalenz aller Normen auf einem endlich
k∇v̂
T̂
dimensionalen Vektorraum mit einer Konstante ĉ > 0 :
ˆ hk .
|||v̂h |||T̂ ≥ ĉ k∇v̂
T̂
−2 ˆ
2
2
2
QT (a|∇vh |2 ) ≥ c| det BT |h−2
T |||v̂h |||T̂ ≥ c| det BT |hT k∇v̂h kT̂ ≥ c k∇vh kT ,
bzw. die gleichmäßige Koerzitivität der Bilinearformen ah (·, ·) :
ah (vh , vh ) ≥ ck∇vh k2 ,
vh ∈ Vh .
(3.5.129)
(ii) Fehlerabschätzung: Mit Hilfe der Koerzitivitätsabschätzung (3.5.129) folgt für den Fehler
ηh := uh − ũh ∈ Vh :
c k∇ηh k2 ≤ ah (uh − ũh , ηh ) = ah (uh , ηh ) − ah (ũh , ηh )
≤ (ah − a)(uh , ηh ) + (l − lh )(ηh ).
Dies impliziert
n |(a − a)(u , v )| |(l − l )(v )| o
h
h
h
h h
.
+
vh ∈Vh
k∇vh k
k∇vh k
k∇ηh k ≤ c max
Zusammen mit der bekannten H 1 -Fehlerabschätzung
k∇(u − uh )k ≤ chm kukH m
folgt
n |(a − a)(u , v )| |(l − l )(v )| o
h
h h
h
h
.
+
vh ∈Vh
k∇vh k
k∇vh k
k∇(u − ũh )k ≤ chm kukH m + c max
Im nächsten Schritt werden wir zeigen, daß
n |(a − a)(u , v )| |(l − l )(v )| o
h
h
h
h h
≤ c hmin{m,r−m+2} kukH m .
+
vh ∈Vh
k∇vh k
k∇vh k
max
(3.5.130)
Dies impliziert dann den ersten Teil der Behauptung
k∇(u − ũh )k ≤ chmin{m,r−m+2} kukH m .
(3.5.131)
129
(iii) Konsistenz: Als nächstes schätzen wir den Abstand“ zwischen a(·, ·) und ah (·, ·) sowie
”
l(·) und lh (·) ab. Für uh , vh ∈ Vh folgt mit Hilfe der Abschätzung des Integrationsfehlers in
Satz 3.15:
X Z
a∇uh ∇vh dx − QT (a∇uh ∇vh )
|(a − ah )(uh , vh )| ≤
T
T ∈Th
≤ cq
X
hrT
T ∈Th
Z
T
|∇r (a∇uh ∇vh )| dx.
Durch Ausdifferenzieren erhalten wir
|(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH r (T ) k∇vh kH r (T ) ,
wobei die Konstante c wesentlich durch Schranken für die Ableitungen der Koeffizientenfunktion
a(x) bestimmt ist. Bei Beachtung von vh|T ∈ Pm−1 ergibt sich
|(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH m−2 (T ) k∇vh kH m−2 (T ) .
Mit Hilfe der inversen Beziehung“ für finite Elemente gilt
”
k∇vh kT ,
k∇vh kH m−2 (T ) ≤ ch2−m
T
womit folgt:
|(a − ah )(uh , vh )| ≤ chr−m+2
X
T ∈Th
k∇uh k2H m−2 (T )
1/2
k∇vh k.
Die Terme in uh werden unter Verwendung der Knoteninterpolierenden Ih u ∈ Vh und mit Hilfe
der inversen Beziehung sowie der lokalen Interpolationsabschätzungen wie folgt abgeschätzt:
k∇uh kH m−2 (T ) ≤ kuh − Ih ukH m−1 (T ) + kIh u − ukH m−1 (T ) + kukH m−1 (T )
≤ chT2−m kuh − Ih ukH 1 (T ) + chT k∇m ukT + kukH m−1 (T )
ku − Ih ukH 1 (T ) + kukH m (T )
≤ chT2−m kuh − ukH 1 (T ) + ch2−m
T
≤ chT2−m kuh − ukH 1 (T ) + kukH m (T ) .
Zusammenfassen der bisherigen Abschätzungen ergibt
|(a − ah )(uh , vh )| ≤ chr+2−m h2−m kuh − ukH 1 + kukH m k∇vh k,
und unter Verwendung der bekannten H 1 -Fehlerabschätzung kuh − ukH 1 ≤ chm−1 kukH m :
|(a − ah )(uh , vh )| ≤ chr+2−m kukH m k∇vh k.
(3.5.132)
Auf analoge Weise erschließen wir
|(l − lh )(vh )| ≤ chr−m+2 k∇vh k kukH m .
(3.5.133)
Die Abschätzungen (3.5.132) und (3.5.133) ergeben (3.5.130) und damit das Resultat (3.5.131).
(iv) L2 -Fehlerabschätzung: Zur Abschätzung des Fehlers in der L2 -Norm bedienen wir uns wieder
130
eines Dualitätsarguments. Sei z ∈ V die (eindeutige) Lösung des Hilfsproblems
−∇ · {a∇z} = uh − ũh
in Ω,
z = 0 auf ∂Ω.
Wegen der angenommenen Glattheit von a und der Konvexität von Ω ist z ∈ H 2 (Ω) und
genügt der a-priori Abschätzung
kzkH 2 ≤ ckuh − ũh k.
Sei zh ∈ Vh die Ritz-Projektion von z . Mit dieser Konstruktion erhalten wir mit Hilfe der
Galerkin-Orthogonalität:
kuh − ũh k2 = a(uh − ũh , z) = a(uh − ũh , zh )
= a(uh , zh ) − (a − ah )(ũh , zh ) − ah (ũh , zh )
= (l − lh )(zh ) − (a − ah )(ũh , zh ).
Die beiden Störungsterme werden nun analog wie unter (iii) abgeschätzt. Zunächst gilt wieder
mit Hilfe der inversen Beziehung:
X
hrT k∇ũh kH m−2 (T ) k∇zh kH m−2 (T )
|(a − ah )(ũh , zh )| ≤ c
T ∈Th
≤ chr+3−m
X
T ∈Th
k∇ũh k2H m−2 (T )
1/2 X
T ∈Th
k∇zh k2H 1 (T )
1/2
.
Für die beiden Summen erhalten wir analog wie oben unter (iii):
X
T ∈Th
sowie
k∇ũh k2H m−2 (T )
X
T ∈Th
1/2
k∇zh k2H 1 (T )
kũh − ukH 1 + kukH m ,
≤ ch2−m
T
1/2
≤ ckzkH 2 ≤ ckuh − ũh k.
Kombination dieser Abschätzungen und Berücksichtigung der schon bewiesenen H 1 -Fehlerabschätzung
ergibt dann:
|(a − ah )(ũh , zh )| ≤ chr−m+3 kuh − ũh kkukH m .
(3.5.134)
|(l − lh )(zh )| ≤ chr−m+3 kuh − ũh k.
(3.5.135)
Analog erschließen wir
Kombinieren aller vorausgehenden Beziehungen ergibt
kuh − ũh k ≤ chr−m+3 kukH m .
Zusammen mit der bekannten L2 -Fehlerabschätzung für eh = u − uh erhalten wir schließlich
ku − ũh k ≤ chmin{m,r−m+3} kukH m ,
Q.E.D.
131
Bemerkung 3.12: Die Aussage von Satz 3.16 kann so interpretiert werden, daß zur Vermeidung
einer Reduzierung der Konvergenzordnung O(hm−1 ) in der Energie-Norm eine Quadraturformel der Ordnung r ≥ 2m − 3 verwendet werden sollte. Damit würden dann im Falle eines
konstanten Koeffizienten a die Matrixelemente anm exakt berechnet werden. Für bloße Konvergenz ũh → u (h → 0) wäre die Wahl r ≥ max{d, m − 2} ausreichend, vorausgesetzt die
Zulässigkeitsbedingung ist erfüllt.
132
3.6 A posteriori Fehleranalyse und Gittersteuerung
Eine wichtige Rolle bei der Lösung von partiellen Differentialgleichungen spielen die beiden
Aspekte Fehlerkontrolle und Gittersteuerung. Hat man eine approximative Lösung uh berechnet, ist es von Interesse, den Fehler zwischen dieser Näherung und der exakten Lösung u bzgl.
eines geeigneten Maßes abzuschätzen. Zu diesem Zweck dienen sog. a-posteriori Fehlerschätzer“,
”
welche im besten Fall ausschließlich von berechneten Größen und den Daten f abhängen. In
diesem Abschnitt wollen wir einfache residuen-basierte Fehlerschätzer für das Modellproblem
der 1. RWA des Laplace-Operators herleiten.
Eine globale Verfeinerung des ganzen Rechengebietes ist in drei Dimensionen in der Regel nicht realisierbar, da der Speicherplatz auf den verfügbaren Rechnern dazu nicht ausreicht.
Deshalb versucht man, nur dort lokal zu verfeinern, wo es die Lösungsstruktur bzw. die Genauigkeitsanforderungen verlangen. Unter optimaler Gittersteuerung wird dabei verstanden, möglichst
wenige markierte Elemente des Gitters zu verfeinern, so daß der Fehler in möglichst wenigen
Schritten unter eine vorgegebene Toleranz gedrückt wird. Die Wahl der zu verfeinernden Elemente trifft man aufgrund sog. lokaler Fehlerindikatoren“, aus denen sich der globale Fehlerschätzer
”
zusammensetzt. Solche Gittersteuerungsmethoden werden wir im zweiten Teil dieses Abschnitts
diskutieren.
3.6.1 Allgemeine a posteriori Fehlerabschätzung
Aus der a priori Fehlerschätzung aus Abschnitt 3.4 konnten wir die Konvergenzordnung des
Diskretisierungsfehlers eh = u − uh schon für verschiedene Normen herleiten:
– Energienorm-Fehlerabschätzung:
– L2 -Norm-Fehlerabschätzung:
– L∞ -Abschätzung:
k∇eh k ≤ ci cs h kukH 2 ,
keh k ≤ ci cs h2 kukH 2 ,
maxΩ |eh | ≤ ci cs h2 | ln(h)| M2 (u),
mit lokalen Interpolationskonstanten ci und globalen Stabilitätskonstanten cs . Leider sind diese
Abschätzungen für eine quantitative Fehlerkontrolle nicht zu gebrauchen, da die nötigen Informationen über die höheren Ableitungen der exakten Lösung u fehlen und insbesondere präzise
Abschätzungen für die Stabilitätskonstanten cs i.a. nicht zur Verfügung stehen. Ist aber der
Charakter einer lokalen Singularität der Lösung bekannt, wie z.B. im Fall von Ecken- oder
”
Kantensingulariutäten“, so kann diese Information zur vorab Anpassung des Gitters verwendet
werden. Dabei wird die Gitterweite h in Richtung auf die singuiläre Stelle hin systematisch
verkleinert, etwa gemäß h(r) ≈ h0 r α wobei der Exponent α > 1 aus dem bekannten singulären
Verhalten der Ableitungen der Lösung abgeleitet wird.
In allgemeinen Situationen muß man sich aber heuristischer Methoden zur Bestimmung der
Regularität der Lösung bedienen. Dies läuft (in Anlehnung an die traditionelle, abschneidefehlerbasierte Vorgehensweise bei Differenzenverfahren) auf die Schätzung der lokalen Glattheit der
unbekannten Lösung aus der berechneten numerischen Approximation hinaus. Zum Beispiel kann
man versuchen, auf einem Zellblock (etwa aus 2d Zellen) aus einer linearen Näherungslösung uh
durch Anwendung eines Differenzenquotienten ∇2h zweiter Ordnung im Schwerpunkt zT einer
133
Zelle T ∈ Th eine Schätzung der zweiten Ableitungen von u auf T zu gewinnen:
max |∇2 u||T ≈ ηT := |∇2h uh (zT )||T .
T
(3.6.136)
Auf der Basis dieses Indikators ließen sich dann Strategien zu lokaler Gitterverfeinerung oder
-vergröberung aufstellen: Ist zum Beispiel ηT auf einer Zelle T ∈ Th überdurchschnittlich groß,
so wird diese in Teilzellen zerlegt. Diese Strategie der ad hoc Gitteranpassung erfordert keinen
großen Aufwand und funktioniert in der Praxis in vielen Fällen erstaunlich gut. Daher sind
Varianten dieser Strategie derzeit auch in vielen kommerziellen Programmen realisiert, wenn
diese überhaupt Gitteradaption beinhalten. Dabei gibt es aber die folgenden grundsätzlichen
Schwächen:
– Die Auswertung von (3.6.136) liefert keine Aussage über die tatsächliche Größe des Fehlers
eh = u − uh .
– Die auf den lokalen Indikatoren ηT basierende Gitterverfeinerungsstrategie geht davon aus,
daß der gemessene“ Fehler in T auch dort entstanden ist und durch lokale Verfeinerung
”
von T reduziert werden kann. Dies ist aber i.a. nicht richtig, da dabei das Phänomen der
globalen Fehlerakkumulation“ (auch pollution effect“ genannt) vernachlässigt wird.
”
”
Ziel der folgenden Diskussion ist es, über eine a posteriori Fehleranalyse via Dualitätsargumente
systematisch auswertbare und zuverlässige Fehlerschätzer zu entwickeln, aus denen auch effiziente Kriterien zur lokalen Gitteranpassung abgeleitet werden können. Wir betrachten dazu wieder
das Modellproblem
−∆u = f
in Ω,
u = 0 auf ∂Ω,
(3.6.137)
auf einem (nicht notwendig konvexen) Polygon- oder Polyedergebiet Ω ⊂ Rd . Die durch die
Variationsgleichung
(∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V = H01 (Ω),
(3.6.138)
definierte schwache Lösung u ∈ H01 (Ω) wird durch ein Galerkin-Finite-Elemente-Verfahren approximiert. Wir konzentrieren uns im folgenden auf die Approximation mit linearen“ finiten
”
(1)
Elementen. Die Näherungslösung uh = Rh u ∈ Vh ⊂ V ist bestimmt durch die Gleichung
(∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh .
(3.6.139)
Bei der Schätzung des Fehlers eh muß man sich für ein geeignetes Fehlermaß“ entscheiden,
”
welches sich am Bedarf der betrachteten Anwendung orientieren sollte. Beispiele sind etwa wie
schon oben erwähnt die traditionellen Maße Energienorm“, L2 -Norm sowie L∞ -Norm. Weitere
”
Beispiele sind:
– Mittelwerte:
– Linienintegrale:
– Ableitungswerte:
|(eh , ψ)Ω |,
ψ ∈ C(Ω),
|(eh , ψ)Γ |,
|∂i eh (a)|,
ψ ∈ C(∂Ω),
a ∈ Ω.
Um alle diese Sonderfälle im Rahmen einer einheitlichen Theorie behandeln zu können, führen
wir zunächst den Begriff des Fehlerfunktionals“ ein. Dies ist ein (der Einfachheit halber als
”
134
linear angenommenes) Funktional
J(·) : V → R,
bzgl. dem der Fehler eh geschätzt werden soll; d.h. gesucht ist eine berechenbare Schranke
für J(eh ) = J(u) − J(uh ) . Zu einem solchen Fehlerfunktional gehört eine (eindeutige) duale
”
Lösung“ z ∈ V , welche als Lösung des zugehörigen dualen Problems“ bestimmt ist:
”
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V.
(3.6.140)
Testen wir in (3.6.140) mit ϕ = eh ∈ V , so ergibt sich unter Berücksichtigung der GalerkinOrthogonalität die Fehleridentität
J(eh ) = (∇eh , ∇z) = (∇eh , ∇(z − ψh )),
ψh ∈ Vh .
(3.6.141)
Dies wird nun weiter mit Hilfe von elementweise partieller Integration umgeformt zu
X J(eh ) =
− (∆eh , z − ψh )T + (∂n eh , z − ψh )∂T
T ∈Th
=
X (f + ∆uh , z − ψh )T − (∂n uh , z − ψh )∂T .
T ∈Th
Da z − ψh stetige Spuren entlang ∂T hat und in der obigen Summe jede Kante zweimal auftritt
mit wechselnder Richtung der Normalableitung ∂n uh , erhalten wir
X (3.6.142)
J(eh ) =
(f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T ,
T ∈Th
wobei auf inneren“ Kanten [∂n uh ]|Γ := ∂n uh|T + ∂n′ uh|T ′ jeweils den Sprung der Normalablei”
tung über Γ ⊂ ∂T zur Nachbarzelle bedeutet. Entlang von Kanten am Rand, Γ ⊂ ∂Ω , setzen
wir [∂n uh ]|Γ := 2∂n uh . Diese Fehleridentität beinhaltet Information über die Abhängigkeit des
Fehlerterms J(eh ) von den lokalen Residuen“ RT := (f + ∆uh )|T und r∂T := − 12 [∂n uh ]|∂T :
”
∂J(eh )
≈ (z − ψh )|T ,
∂RT
∂J(eh )
≈ (z − ψh )|∂T .
∂r∂T
(3.6.143)
Damit können wir hoffen, auf das spezielle Zielfunktional J(eh ) bezogene Kriterien für lokale
Gitterverfeinerung und damit Reduzierung dieser Residuen zu gewinnnen. Dabei mißt“ das
”
Zellresiduum“ R(uh ) das Erfülltsein der Differentialgleichung durch die Näherungslösung uh
”
und das Kantenresiduum“ r(uh ) deren Glattheit“.
”
”
Von der exakten Fehlerdarstellung (3.6.142) können wir nun in mehreren Schritten weitere,
gegebenenfalls leichter auswertbare Fehlerabschätzungen ableiten. Zunächst ist
X (3.6.144)
|J(eh )| ≤ (f + ∆uh , z − ψh )T − 21 ([∂n uh ], z − ψh )∂T ,
T ∈Th
und weiter
|J(eh )| ≤
X (f + ∆uh , z − ψh )T − 1 ([∂n uh ], z − ψh )∂T .
2
T ∈Th
(3.6.145)
135
Bei Beachtung von z−ψh|∂Ω = 0 folgt dann mit Hilfe der Hölderschen Ungleichung:
|J(eh )| ≤
o
X n
kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T .
(3.6.146)
T ∈Th
Die letzte Abschätzung schreiben wir in der kompakten Form
X |J(eh )| ≤ η(uh ) :=
ρT (uh ) ωT (z) + ρ∂T (uh ) ω∂T (z)
(3.6.147)
T ∈Th
mit den Zellresiduentermen“
”
ρT (uh ) := kf + ∆uh kT ,
−1/2
ρ∂T (uh ) := 12 hT
k[∂n uh ]k∂T \∂Ω ,
und den Zellgewichten“
”
ωT (z) := kz − Ih zkT ,
1/2
ω∂T (z) := hT kz − Ih zk∂T .
Die Fehlerdarstellung (3.6.142) bzw. die Fehlerabschätzung (3.6.147) sind nicht unmittelbar
auswertbar. Zwar sind die Residuenterme“ R(uh ) = f + ∆uh und r(uh ) = − 12 [∂n uh ] aus der
”
Näherung uh berechenbar, doch die Wichtungsfaktoren z − ψh sind nur implizit über das duale
Problem (3.6.140) gegeben und müssen gesondert bestimmt werden. Mit dieser kritischen Frage
werden wir uns im Folgenden noch eingehender beschäftigen.
Die Zellgewichte lassen sich bei Wahl ψh := Ih z mit Hilfe der lokalen Interpolationsfehlerabschätzungen aus Abschnitt 3.3 weiter abschätzen durch
ωT (z) ≤ ci h3T max{|∇2 z|}.
T
(3.6.148)
Hierbei muß natürlich vorausgesetzt werden, daß die duale Lösung z ∈ H 2,∞ (Ω) ist. Wir werden später sehen, wie man sich von dieser sehr einschränkenden Annahme in gewisser Weise
befreien kann. Die Interpolationskonstante ci ist von verschiedenen Faktoren abhängig: Von
dem Polynomgrad der verwendeten Interpolierenden, vom Referenzelement T̂ sowie von den
Transformationen σT : T̂ → T . Sie stellt einen Unsicherheitsfaktor dar. Genaueres Nachrechnen ergibt eine Größenordnung von ci ≈ 0, 1 − 10 .
Die a posteriori Fehlerabschätzung (3.6.147) ist zuverlässig“ im Sinne, daß sie eine siche”
re obere Schranke für den Fehler |J(eh )| liefert, vorausgesetzt, es liegen zuverlässige Werte
für die Gewichte ωT (z) und ω∂T (z) vor. Sie wäre auch effizient“, wenn für den zugehörigen
”
Effektivitätsindex“ ( Überschätzungsfaktor“) gilt:
”
”
Ieff :=
η(uh )
≤ c0
|J(eh )|
(h → 0).
(3.6.149)
Bemerkung 3.13: Es ist zu bemerken, daß bereits der Übergang von der Fehleridentität“
”
(3.6.142) zur Fehlerabschätzung“ (3.6.144) in gewissen Fällen zu einer groben Überschätzung
”
des tatsächlichen Fehlers führen kann. Betrachten wir hierzu folgendes Beispiel: Auf dem Quadrat
Ω = (−1, 1) × (−1, 1) gilt es, für die Poisson-Gleichung den Punktfehler im Ursprung zu finden:
J(eh ) = eh (0) . Es ist möglich, die rechte Seite f und das Gitter Th so anti-symmetrisch
bzgl. x = 0 zu konstruieren, daß u(0) = 0 = uh (0) . In diesem Fall wird aber in der Regel
η(uh ) ≈ h2 > 0 sein, d.h.: Ieff = ∞ .
136
3.6.2 Spezielle a posteriori Fehlerschätzer
Der oben abgeleitete allgemeine Fehlerschätzer wird nun für verschiedene spezielle Fehlerfunktionale ausgewertet. In den betrachteten Fällen lassen sich die Gewichte ωT (z), ω∂T (z) analytisch
abschätzen. Wir beschränken uns hier auf die Betrachtung von P1 -Elementen.
a) Energienorm-Fehlerschätzer:
Zur Abschätzung des Energienormfehlers“ k∇eh k wählen wir das Fehlerfunktional
”
J(ϕ) := k∇eh k−1 (∇ϕ, ∇eh ),
so daß wir für ϕ = eh automatisch J(eh ) = k∇eh k haben. Für die zugehörige Lösung z ∈ V
des dualen Problems
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.150)
gilt dann
k∇zk2 = k∇eh k−1 (∇z, ∇eh ) ≤ k∇zk,
woraus sich die folgende einfache a priori Abschätzung k∇zk ≤ 1 ergibt. Ausgehend von der
allgemeinen Fehlerabschätzung (3.6.146) erhalten wir
X k∇eh k ≤
T ∈Th
Wir wählen nun ψh := Ih z als eine verallgemeinerte“ Knoteninterpolierende von z , für welche
”
die folgende lokale Fehlerabschätzung gilt:
1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ c̃i hT k∇zkT̃ ,
(3.6.151)
wobei T̃ := ∪{T ′ ∈ Th : T ′ ∩ T 6= ∅} . Damit folgt dann mit den Residuen ρT (uh ) und ρ∂T (uh ) :
X
−1/2
k∇eh k ≤ c̃i
hT kf + ∆uh kT + 12 hT k[∂n uh ]k∂T \∂Ω k∇zkT̃
T ∈Th
≤ c
Wegen
X
T ∈Th
1/2
1/2 X
k∇zk2T̃
.
h2T ρT (uh )2 + ρ∂T (uh )2
T ∈Th
X
T ∈Th
k∇zk2T̃
ergibt sich schließlich das folgende Resultat:
1/2
≤ ck∇zk ≤ c,
Satz 3.17 (a posteriori Energienormfehler): Für den Fehler eh := u − uh gilt die a posteriori Abschätzung bzgl. der Energienorm:
X
1/2
h2T ρT (uh )2 + ρ∂T (uh )2
.
(3.6.152)
k∇eh k ≤ ηE (uh ) := c
T ∈Th
137
Diese Abschätzung ist in folgendem Sinne “scharf“:
X
1/2
h2T kf k2T
.
ηE (uh ) ≤ ck∇eh k + c
(3.6.153)
T ∈Th
Beweis: Es bleibt, die Abschätzung (3.6.153) zu beweisen. Dazu verwenden wir folgende Regularitätsaussage: Für eine Funktion v ∈ H 1 (Ω) mit der Eigenschaft ∆v ∈ L2 (Ω) existiert
∂n v ∈ L2 (∂Ω) und genügt der Abschätzung
k∂n vk∂Ω ≤ cΩ k∆vkΩ + k∇vkΩ .
Wir wenden dies auf der Referenzzelle T̂ an und erhalten mit Hilfe des üblichen Transformationsarguments auf jeder einzelnen Zelle T ∈ Th für entsprechende Funktionen v ∈ H 1 (T ) die
Abschätzung
2
(3.6.154)
k∂n vk2∂T ≤ c∗ hT k∆vk2T + h−1
T k∇vkT ,
mit einer von h unabhängigen Konstanten c∗ .
Auf jeder Zelle T ∈ Th ist uh|T ∈ P1 (T ) und folglich
ρT (uh )2 = kf + ∆uh k2T = kf k2T .
Für ein T ∈ Th sei T̃ := ∪{T ′ ∈ Th | T ′ und T haben gemeinsame Kante.} . Wegen der Stetigkeit
von ∂h u über Zellkanten hinweg, ist [∂n uh ] = −[∂n eh ] . Mit Hilfe der Abschätzung (3.6.154)
folgt damit wegen hT ≈ hT ′ für T ′ ∈ T̃ :
X
k∂n eh k2∂T ′ \∂Ω
h2T ρ∂T (uh )2 = 14 hT k[∂n eh ]k2∂T \∂Ω ≤ chT
≤ c∗ hT
X
T ′ ∈T̃
T ′ ∈T̃
2
hT ′ k∆eh k2T ′ + h−1
T ′ k∇eh kT ′
X
= c∗
h2T kf k2T ′ + k∇eh k2T ′ .
T ′ ∈T̃
Dies impliziert nach Summation über T ∈ Th die behauptete Abschätzung (3.6.153). Q.E.D.
Bemerkung 3.14: Mit einer etwas aufwendigeren Argumentation kann man die folgende verschärfte a posteriori Abschätzung herleiten:
X
1/2
h2T h2T k∇f k2T + ρ∂T (uh )2
.
ηE (uh ) ≤ c
T ∈Th
Diese besagt, daß im Fehlerschätzer ηE (uh ) in der Regel der Einfluß der Gleichungsresiduen
kf + ∆uh kT gegenüber den Regularitätsresiduen k[∂n uh ]k∂T \∂Ω vernachlässigt werden können.
Dies ist in dieser Form allerdings nur richtig für lineare bzw. bilineare finite Elemente.
b) L2 -Norm-Fehlerschätzer:
Zur Abschätzung des L2 -Fehlers keh k wählen wir das Fehlerfunktional
138
J(ϕ) := keh k−1 (ϕ, eh ),
womit automatisch J(e) = keh k gilt. Die zugehörige Lösung z ∈ V des dualen Problems
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.155)
ist dann auf dem konvexen Gebiet Ω auch in H 2 (Ω), und es gilt die a priori Abschätzung
k∇2 zk ≤ k∆zk = 1 . Ausgehend von der Fehlerabschätzung (3.6.146) erhalten wir wieder
X keh k ≤
T ∈Th
Wir können nun ψh := Ih z als die normale Knoteninterpolierende von z wählen:
1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ ci h2T k∇2 zkT .
(3.6.156)
Damit folgt dann wieder mit den oben definierten Residuen ρT (uh ) und ρ∂T (uh ) :
X
−1/2
h2T kf + ∆uh kT + 21 hT k[∂n uh ]k∂T \∂Ω k∇2 zkT
keh k ≤ ci
T ∈Th
≤ c
Wegen
X
T ∈Th
1/2 X
1/2
h4T ρT (uh )2 + ρ∂T (uh )2
k∇2 zk2T
.
T ∈Th
X
T ∈Th
k∇2 zk2T
ergibt sich schließlich das folgende Resultat:
1/2
= k∇2 zk ≤ 1,
Satz 3.18 (a posteriori L2 -Normfehler): Für den Fehler eh := u − uh gilt die a posteriori
Abschätzung bzgl. der L2 -Norm:
X
1/2
h4T ρT (uh )2 + ρ∂T (uh )2
.
(3.6.157)
keh k ≤ ηL2 (uh ) := c
T ∈Th
Diese Abschätzung ist ebenfalls scharf“ in folgendem Sinne:
”
X
1/2
h4T kf k2T
.
ηL2 (uh ) ≤ ckeh k + c
(3.6.158)
T ∈Th
Beweis: Der Beweis verläuft analog wie bei der Energienorm-Fehlerabschätzung. Diesmal basiert
die Herleitung der Umkehrabschätzung (3.6.158) auf der zellweisen Beziehung
2
k∂n vk2∂T ≤ c∗ {hT k∆vk2T + h−3
T kvkT },
(3.6.159)
welche ebenfalls durch Transformation von der Einheitszelle abgeleitet wird. Der Rest des Beweises sei als Übungsaufgabe gestellt.
Q.E.D.
139
c) Punktfehler-Schätzer:
Zur Abschätzung des Fehlers eh (a) in einem festen Punkt P ∈ Ω würden wir gern das Fehlerfunktional J(ϕ) := ϕ(P ) wählen. Dieses ist auf stetigen Funktionen, aber nicht auf dem ganzen
Lösungsraum V = H01 (Ω) definiert, so daß die oben entwickelte allgemeine Theorie nicht unmittelbar anwendbar wäre. Deshalb wählen wir eine Kugelumgebung Bε := {x ∈ Rd : |x − P | < ε}
des Punktes P und arbeiten statt dessen mit dem regularisierten Funktional
Z
−1
ϕ dx,
Jε (ϕ) := |Bε |
Bε
welches sicher auf ganz V definiert und beschränkt ist. Der Regularisierungsparameter ε wird
üblicherweise gleich einer vorgegebenen Fehlertoleranz T OL gesetzt. Für hinreichend glatte
Funktionen ϕ ist dabei (Fehler der Mittelpunktregel)
|ϕ(P ) − Jε (ϕ)| ≤ c ε2 .
(3.6.160)
Wir betrachten den Fall d = 2 . Die Lösung zε ∈ V des zugehörigen dualen Problems
(∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
(3.6.161)
ist dann eine regularisierte“ Greensche Funktion und verhält sich wie
”
−2
zε (x) ≈ log(|x−P | + ε),
|∇2 zε | ≈ |x−P | + ε .
Die Gewichte in der a posteriori Fehlerabschätzung (3.6.147) gestatten daher die Abschätzung
ωT (zε ) + ω∂T (zε ) ≤ ch2T k∇2 zε kT ≤ c h3T d−2
T ,
mit dT := maxx∈T {|x−a| + ε} . Wir finden also als obere Schranke für den Punktfehler:
|eh (P )| ≤ c
X
T ∈Th
ρT (uh )h2T k∇2 zε kT + cε2 ≤ c
X
ρT (uh )
T ∈Th
h3T
+ cε2 .
d2T
In diesem Fall ist aber die a-priori Bestimmung der Konstante c praktisch unmöglich.
d) Ein hyper-singulärer Fall
Einen kuriosen Sonderfall stellt die folgende Auswertungsgröße dar:
Z
Z
Z
∆u dx = − f dx .
∂n u ds
=
J(u) :=
∂Ω
Ω
Ω
Dieser mittlere Normalfluß“ ließe sich offenbar auch direkt aus den Daten f berechnen. Zur
”
Illustration wollen wir aber annehmen, daß diese Information nicht ausgenutzt wird, sondern
statt dessen J(u) durch J(uh ) approximiert wird. Das Funktional J(·) ist wieder nicht auf
dem ganzen Lösungsraum V definiert (wohl aber auf der reguläreren Lösung u ∈ V ∩ H 2 (Ω) ).
Zur Anwendung unserer allgemeinen Theorie muß das Funktional daher zunächst regularisiert
werden. Für das Folgende nehmen wir der Einfachheit halber an, daß Ω der Einheitskreis im
R2 ist. Für ε = T OL setzen wir Sε := {x ∈ Ω, dist{x, ∂Ω} < ε} und erhalten für glattes ϕ :
140
−1
Jε (ϕ) := ε
Z
∂r ϕ dx =
Z
∂Ω
Sε
∂r ϕ ds + O(ε).
Dabei ist ∂n auf Sε auf natürliche Weise durch Fortsetzung von ∂Ω definiert. Die Lösung
zε ∈ V des zugehörigen dualen Problems
(∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
ist dann gegeben durch
zε = −1 in Ω\Sε ,
zε (x) = −ε−1 (1−|x|)
Hieraus ergibt sich die Fehlerabschätzung
X
h2T ρT (uh )k∇2 zε kT ≈
|Jε (eh )| ≤ ci
T ∈Th
auf Sε .
X
... ,
T ∩Sε 6=∅
d.h.: Die Zellen im Innern von Ω tragen nicht zum Gesamtfehler bei. Daher wäre die beste
Strategie zur Gitterverfeinerung, in jedem Verfeinerungszyklus jeweils nur die Zellen entlang
des Randes ∂Ω zu verfeinern. Dies setzt aber voraus, daß die Elemente des Lastvektors, bn =
(n)
(f, ϕh )Ω , exakt berechnet werden. Abbildung 3.11 zeigt ein automatisch verfeinertes Gitter
nach 7 Verfeinerungszyklen sowie die numerisch bestimmte duale Lösung auf diesem Gitter. Die
zugehörigen Ergebnisse sind in Tabelle 3.1 gelistet.
Abbildung 3.11: Verfeinertes Gitter nach 7 Verfeinerungszyklen (links) und die auf diesem Gitter numerisch bestimmte Lösung (rechts).
ηE
optimale“ Strategie
”
L
N
J(eh )
L
N
J(eh )
1
1024
2.91 + 0
1
559
2.90 + 0
2
4096
1.50 + 0
2
1294
1.50 + 0
3
16384
3
3079
4
64768
7.49 − 1
4
7174
5
253858
3.77 − 1
7.48 − 1
5
16738
6
memory
1.73 − 1
exhausted
6
38146
3.62 − 1
1.67 − 1
6.93 − 2
Tabelle 3.1: Resultate mit dem Energienorm-Fehlerschätzer ηE (uh ) und der optimalen“ Strategie.
”
141
Numerische Auswertung des a-posteriori Fehlerschätzers
Wir wollen nun kurz die numerische Auswertung der Fehleridentität (3.6.142) diskutieren:
X J(eh ) = η(uh ) :=
(3.6.162)
(f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T .
T ∈Th
Wir wählen dazu ψh := Ih z , die Knoteninterpolierende von z . Die Qualität der Auswertung
wird durch den sog. Effektivitätsindex“ gemessen:
”
η(u ) h Ieff := .
J(eh )
Alle Methoden der Auswertung von (3.6.162) bedienen sich einer numerischen Lösung zh ∈ Vh
des dualen Problems, welche im einfachsten Fall durch direkte Diskretisierung von (3.6.162) mit
Hilfe des vorliegenden Verfahrens gewonnen wird:
(∇ϕh , ∇zh ) = J(ϕh )
∀ϕh ∈ Vh .
(3.6.163)
Wir unterscheiden zwei Anwendungen der Fehleridentität (3.6.162):
– Überprüfung der Genauigkeit einer auf dem Gitter Th berechneten Näherungslösung uh
und Abbruchkriterium für einen Gitterverfeinerungsprozess: η(uh ) ≤ T OL ?
– Grundlage zur Gewinnung von Kriterien ( Verfeinerungsindikatoren“ ηT ) zur lokalen Git”
teranpassung.
Die folgenden Strategien zur Auswertung von η(uh ) kommen in Betracht (hier beschrieben für
den Fall d-linearer Ansätze auf Rechteckgittern im Rd ):
1. Die duale Lösung z wird durch eine Näherung höherer Ordnung approximiert. Zum Bei(2)
spiel liefert die Approximation z ≈ zh mit der d-quadratischen Ritz-Projektion das
gewünschte asymptotische Verhalten limT OL→0 Ieff = 1 .
2. Die duale Lösung z wird durch eine zellblockweise (je 2d Zellen) d-quadratische Inter(2)
polierende der d-linearen Ritzapproximation approximiert: z ≈ Ih zh . In diesem Fall
beobachtet man limT OL→0 Ieff < 1 (≈ 0.5 − 0.9).
3. Die Differenz z−Ih z wird in Anlehnung an die oben zitierte Interpolationsfehlerabschätzung
mit Hilfe eines skalierten Differenzenquotienten der d-linearen Ritz-Proktion approximiert:
|z −Ih z| ≈ ci,T h2T |∇2h zh | . Dies führt in der Regel auf eine grobe Überschätzung des Fehlers.
In der Praxis wird meist die billige“ und ausreichend genaue Prozedur (2) verwendet. Dabei
”
brauchen insbesondere keine Interpolationskonstanten ci spezifiziert zu werden.
3.6.3 Strategien zur Gittersteuerung
Ziel ist es, den Fehler in dem durch das Fehlerfunktional J(·) beschriebenen Maß unter eine
gewisse vorgegebene Toleranz |J(eh )| ≤ T OL zu bringen und dabei mit dem vorhandenen Speicher auszukommen. Es können also nur eine bestimmte Anzahl von Zellen N ≤ Nmax verwaltet
142
werden. Die Gitterverfeinerung erfolgt dabei standardmäßig durch Kantenbisektion“, d.h. durch
”
Unterteilung einer Zelle T in 2d Teilzellen. Bei Gittervergröberung werden mehrere Zellen zu
einer Makrozelle zusammengefaßt. Wir werden im folgenden hauptsächlich Vierecks- oder Hexaedergitter betrachten. Bei Unterteilung einer Zelle entstehen sog. hängende“ Knoten auf den
”
Zellrändern, so daß das neue Gitter zunächst nicht zulässig wäre. Diese Unzulässigkeit kann
durch verschiedenen Methoden aufgehoben werden. Die meist gebräuchliche ist die Elimination
der zu den hängenden Knoten gehörenden Freiheitsgraden durch lineare Interpolation, wodurch
der entstehende diskrete Ansatzraum wieder konform wird: Vh ⊂ V (s. Abb. 3.12). Dabei wird
der fiktive Knotenwert vh (P ) in einem hängenden Knoten P auf einer Kante Γ ⊂ ∂T mit
Endpunkten P ′ , P ′′ durch die Interpolationsvorschrift vh (P ) := 21 {vh (P ′ )+vh (P ′′ )} festgelegt.
Alle im folgenden gezeigten Beispielrechnungen bedienen sich dieser Technik.
4
x
Abbildung 3.12: Verfeinertes Rechteckitter mit hängendem“ Knoten sowie die Basisfunktion
”
zum Mittelknoten.
Ausgangspunkt zur Gewinnung von Kriterien für die lokale Gitteranpassung ist eine aposteriori Fehlerschätzung der Form
X
|J(eh )| ≈
ηT ,
(3.6.164)
T ∈Th
mit lokalen Fehlerindikatoren“ ηT , welche durch Auswertung der Fehleridentität (3.6.142) mit
”
Hilfe einer der oben beschriebenen Methoden gewonnen werden. Wir erhalten bei Verwendung
von Methode (2):
(2)
(2)
ηT := (f + ∆uh , Ih zh − zh )T − 12 ([∂n uh ], Ih zh − zh )∂T \∂Ω (3.6.165)
und mit Methode (3):
ηT := ci h2T {ρT (uh ) + ρ∂T (uh )} k∇2h zh kT .
(3.6.166)
Wir beschreiben im folgenden das allgemeine Schema eines auf lokalen Fehlerindikatoren ηT
basierenden Gitteranpassungsprozesses:
Nachdem über das Gebiet Ω ein Grobgitter T0 := Th0 mit einer Gitterweitenverteilung h0
gelegt worden ist, sei der Prozeß der adaptiven Gittersteuerung schon L-mal durchlaufen worden.
Wir bestimmen nun auf dem Gitter TL := ThL die approximative Lösung uL ∈ VL := VhL .
Ebenso wird die diskrete duale Lösung zL ∈ VL auf TL berechnet. Nun können die lokalen
Fehlerindikatoren ηT gemäß (3.6.165) oder (3.6.166) für jede Zelle T ∈ TL ausgewertet werden.
143
Wir bezeichnen mit NL ≈ dim(VL ) die Anzahl der Zellen des Gitters TL .
Abbruchabfrage: Ist das Abbruchkriterium η(uh ) ≤ 21 T OL auf dem Gitter TL erfüllt, wird
der Adaptionsprozess abgebrochen und zL als Näherung zu u akzeptiert, welche die Zielgröße
J(u) durch J(uh ) mit der gewünschten Genauigkeit T OL approximiert. Andernfalls wird ein
neuer Adaptionszyklus begonnen.
Adaptionszyklus: Der Übergang vom Gitter TL zum nächsten Gitter TL+1 erfolgt nach einer
der im folgenden beschriebenen Adaptionsstrategien“. Zunächst werden die Zellen T ∈ TL nach
”
der Größe ihrer Indikatorwerte ηT angeordnet,
{Ti , i = 1, ..., NL } :
ηT,1 ≥ ... ≥ ηT,i ≥ ηT,i+1 ≥ ... ≥ ηT,NL .
I) Fehlerbalancierungs-Strategie: Das Ziel ist, die Indikatorwerte so zu balancieren, daß
ηT ≈
T OL
,
NL
T ∈ TL .
(3.6.167)
Dann würde wie gewünscht gelten:
|J(eL )| ≈ η(uL ) ≈
X T OL
= T OL.
NL
T ∈TL
Das Problem bei dieser Strategie ist zum einen, daß die Zahl NL sich während des Verfeinerungsprozesses ständig ändert, und zum anderen, daß die Balancierungsvorschrift (3.6.167) die
delikate Wahl von Parametern 0 < α < β < 1 erfordert:
α
T OL
T OL
≤ ηT ≤ β
.
NL
NL
Für die folgende Diskussion setzen wir der Einfachheit halber α = 1/2, β = 1 . Im ersten Schritt
testet man, ob ηT,1 ≤ T OL/NL ist. Wenn ja“, ist das Abbruchkriterium erfüllt, wenn nein“,
”
”
wird die Zelle T1 verfeinert. Dies führt zu einer Erhöhung von NL auf NL + 3 . Danach wäre
es möglich, daß für alle übrigen Zellen TL,i gilt:
T OL
T OL
≤ ηT,i ≤
.
NL + 3
NL
Der Verfeinerungszyklus wäre also bereits nach dem ersten Schritt zu beenden und auf dem
erhaltenen Gitter TL+1 eine neue Näherungslösung uL+1 zu berechnen. Dies wäre aber sehr
ineffizient. Der Verfeinerungsprozeß sollte daher beschleunigt werden. Dazu überprüft man von
dem Indikator ηT,1 ausgehend und beginnend mit j = 0 , ob
ηT,i ≤
T OL
.
NL + 3j
Ist dies nicht erfüllt, wird das Element Ti geteilt, die Zähler j und i um Eins erhöht, und
man geht zum nächstkleineren ηT,i über. Ist die Bedingung allerdings erfüllt, hat man das
neue Gitter TL+1 gefunden. Diese Balancierungsstrategie ist zwar potentiell optimal, jedoch
mit aufwendigen Abfragen verbunden. Mögliche alternative Strategien, die einfacher sind, aber
weniger gute Ergebnisse liefern, sind die folgenden.
144
II) Fest-Raten-Strategie“: Ziel ist es, in jedem Adaptionszyklus die Anzahl der Gitterzellen
”
NL mit einer festen Rate zu erhöhen oder den Fehlerschätzwert η(uL ) mit einer festen Rate zu
verkleinern. Ausgangspunkt ist wieder eine Anordnung der Zellen von TL nach der Größe der
zugehörigen Indikatorwerte. Zu vorgewählten Prozentsätzen X% und Y % werden die Zellen
so gruppiert, daß (and der Zellanzahl orientierte Strategie)
#{Ti , . . . , TN∗ } ≈
X
NL ,
100
#{TNL −N ∗ +1 , . . . , TNL } ≈
Y
NL ,
100
oder alternativ (am Schätzwert orientierte Strategie)
N∗
X
i=1
ηT,i ≈ Y η(uL ),
NL
X
i=NL
−N ∗ +1
ηT,i ≈ X η(uL ).
Dann werden die Zellen Ti , . . . , TN∗ verfeinert und die Zellen TNL −N ∗ +1 , . . . , NL vergröbert.
Exakte“ Gitteroptimierung
”
Zum Abschluß wollen wir noch diskutieren, daß die Fehlerschätzung (3.6.147)
X
ρT (uh ) ωT (zh )
|J(eh )| ≈ η :=
(3.6.168)
T ∈Th
im Prinzip auch zur direkten Bestimmung eines optimalen“ Gitters mit Gitterweitenfunktion
”
h = h(x) verwendet werden könnte. Dies wird als Nebenprodukt auch eine Rechtfertigung für
die Äquilibrierungsstrategie“ liefern. Zu lösen sind die folgenden Optimierungsaufgaben:
”
(OP I) Bei vorgegebener Fehlertoleranz TOL soll die zu deren Erreichung benötigte Anzahl von
Zellen N (d.h. der numerische Aufwand) minimiert werden:
N → M IN,
η ≤ T OL.
(3.6.169)
(OP II) Bei vorgegebener maximalen Zellzahl Nmax (d.h. begrenzter Speicherkapazität) soll der
Fehler (genauer der Fehlerschätzer) minimiert werden:
η → M IN,
N ≤ Nmax .
(3.6.170)
Wir diskutieren im folgenden nur die für die Praxis relevantere Fragestellung (OP II). Das Optimierungsproblem (OP I) läßt sich mit analogen Argumenten behandeln (Übungsaufgabe). Die
grundlegende Annahme ist, daß die Größen ρT (uh ) sowie ωT (zh ) (nach geeigneter Skalierung)
für T OL → 0 zunehmend bessere, lokale Approximationen gewisser kontinuierlicher Funktionen
Φ(x) bzw. Ψ(x) sind:
−3/2
−1
1
kh−1
h−1
T [∂n uh ]k∂T \∂Ω → Φu (xT ),
T ρT (uh ) = hT kf + ∆uh kT + 2 hT
o
n
−5/2
kz
−
I
zk
,
h
kz
−
I
zk
→ Ψz (zT ),
h−3 ωT (zh ) = max h−3
T
h
h
∂T
T
T
(3.6.171)
(3.6.172)
wobei xT ein gemeinsamer Punkt einer Folge von Zellen T ist. Diese Annahme ist natürlich
im strengen Sinne nicht realistisch, da auf allgemeinen Gitterfolgen (Th )h→0 ein sehr unre-
145
gelmäßiges Konvergenzverhalten auftreten kann. Unter der obigen Annahme gilt mit der Funktion A(x) := Φ(x)Ψ(x) :
Z
X
X
h(x)2 A(x) dx.
(3.6.173)
h4T h−4
ρ
(u
)
ω
(z
)
≈
ρT (uh ) ωT (zh ) =
T
T h
h
T
Ω
T ∈Th
T ∈Th
Für die Zellzahl N haben wir die Darstellung
N =
X
X
1 =
h2T h−2
T
T ∈Th
T ∈Th
Z
≈
h(x)−2 dx.
(3.6.174)
Ω
Damit können wir die Optimierungsaufgabe (OP II) näherungsweiser in kontinuierlicher Form
schreiben als:
Z
Z
2
h(x)−2 dx = Nmax .
(3.6.175)
h(x) A(x) dx → M IN, N (h) :=
F (h) :=
Ω
Ω
Hierbei haben wir o.B.d.A. die Ungleichungsbedingung N ≤ Nmax durch eine Gleichungsbedingung N = Nmax ersetzt, da sich ein minimaler Fehler sicherlich unter maximaler Ausnutzung der möglichen Zellzahl ergibt. Dieses restringierte Optimierungsproblem wird nun mit
dem Lagrange-Formalismus der Variationsrechnung gelöst. Dazu definieren wir die Lagrange”
Funktion“
L(h, λ) := F (h) + λ {N (h) − Nmax }
mit einem skalaren Lagrange-Parameter λ ∈ R. Jede Lösung des Optimierungsproblems ist dann
notwendig stationärer Punkt (Sattelpunkt) von L . Zur Bestimmung eines solchen Sattelpunkts
machen wir den Ansatz
d
L(h + tϕ, λ + tµ)|t=0 = 0
dt
∀ϕ ∈ C(Ω), ∀µ ∈ R.
Auswertung dieser Beziehung ergibt
Z
Z
2 h(x)A(x)ϕ(x) dx − 2λ h−3 (x)ϕ(x) dx = 0
Ω
Ω
sowie
µ
bzw. notwendig
Z
−2
h(x)
Ω
−3
h(x)A(x) − λh
dx − Nmax
= 0 ∀µ ∈ R,
h(x)−2 dx = Nmax .
Ω
h(x) =
W :=
Z
(x) = 0,
Hieraus ergibt sich, daß
und weiter
Z
Ω
A −1/4
λ
∀ϕ ∈ C(Ω)
,
A(x)1/2 dx = λ1/2 Nmax .
146
Damit erhalten wir einerseits den Lagrange-Parameter,
λ=
W 2
,
Nmax
und andererseits eine Gleichung für die gesuchte optimale“ Gitterweitenverteilung
”
W 1/2
hopt (x) =
A(x)−1/4 .
Nmax
(3.6.176)
(3.6.177)
Als Nebenprodukt dieser Rechnung ergibt sich für die optimale Gitterweite die Beziehung
ηT = h4T AT = λ ≡ konst.,
(3.6.178)
d.h.: Die an der Äquilibrierung der lokalen Fehlerindikatoren ηT orientierten Gittersteuerungsstrategien führen tatsächlich auf optimale Gitterweitenverteilungen.
Wir erwähnen noch, daß das zu (OP I) duale“ Optimierungsproblem (OP II) auf die folgende
”
Lösung führt:
hopt (x) =
T OL 1/2
W
A(x)−1/4 .
(3.6.179)
Die Größe W ist bei den üblichen Fehlerfunktionalen wohl definiert; dies beinhaltet sogar so
singuläre Fälle wie die Punktauswertung von Ableitungen J(u) = ∂i u(a) , A(x) ∼ |x − a|−3 .
Erst die Auswertung von zweiten Ableitungen J(u) = ∂i2 u(a) macht hier Probleme.
3.6.4 Ein Testbeispiel
Wir wollen die bisher erzielten Ergebnisse anhand eines konkreten Beispiels illustrieren. Dazu
wird wieder das übliche Modellproblem betrachtet:
−∆u = f
in Ω,
u = 0 auf ∂Ω.
(3.6.180)
Wir wollen den Punktwert ∂1 u(P ) für ein P ∈ Ω berechnen. Das zugehörige Funktional ist
wieder nicht auf dem ganzen Lösungsraum V = H01 (Ω) definiert und muß regularisiert werden.
Wir setzen dazu mit ε := T OL :
Z
−1
Jε (ϕ) := |Bε |
∂1 u dx .
(3.6.181)
Bε
Testfall 1: Sei Ω := (−1, 1)2 und P = 0 (siehe Abb. 3.13). Die zu dem Funktional Jε (·)
gehörige duale Lösung zε verhält sich dann wie |∇2 zε (x)| ≈ (|x| + ε)−3 . Dies impliziert, daß
|∂1 eh (0)| ≈ ci
X h4
T
ρT (uh ),
d3T
T ∈Th
(3.6.182)
147
mit dT := |xT | + ε und dem Mittelpunkt xT von T . Wir wollen hierfür eine optimale Gitterweitenverteilung bestimmen. Ausgangspunkt ist die Äquilibrierungsbedingung
ηT ≈
h4T
T OL
≈
3
N
dT
⇒
3/2
h2T ≈ dT
T OL 1/2
N
.
Hieraus ergibt sich
N=
X
h2T h−2
T =
N 1/2
N 1/2 X
−3/2
≈
h2T dT
T OL
T OL
T ∈Th
T ∈Th
und folglich Nopt ≈ T OL−1 . Bei Verwendung des Energienorm-Fehlerschätzers (3.6.152) zur
Gitterverfeinerung ergibt sich dagegen die Gitterkomplexität Nopt ≈ T OL−2 . Dieses vorhergesagte Verhalten der verschiedenen Gitterverfeinerungsprozesse wird durch die numerischen
Ergebnisse in Tabelle 3.2 gut bestätigt.
TOL
N
L
ηweight(uh )
Ieff
4−2
|∂1 eh (0)|
148
6
7.51e-1
5.92e-2
0.08
4−3
940
9
4.10e-1
1.42e-2
0.03
4−4
4912
12
4.14e-3
3.50e-3
0.65
4−5
20980
15
2.27e-4
9.25e-4
4.16
4−6
86740
17
5.82e-5
2.38e-4
4.16
Tabelle 3.2: Resulte der Berechnung von ∂1 u(0) unter Verwendung des gewichteten a posteriori
Fehlerschätzers ηweight (uh ) für verschiedenen Verfeinerungslevel L ; der Effektivitätsindex“ ist
”
definert durch Ieff := |ηweight (uh )/∂1 eh (0)|.
Wir betonen, daß die richtige Wahl des Regularisierungsparameters ε = T OL in (3.6.181)
für den Lösungsprozess wichtig ist. Die triviale Alternative ε = hmin ist automatisch realisiert,
wenn zur Berechnung der Gewichte ωT (z) die numerisch bestimmte, diskrete, duale Lösung
zh ∈ Vh verwendet wird (siehe Abb. 3.13). Dies kann bei sehr singulären“ Funktionalen zu
”
starker lokaler Überverfeinerung, d.h. zu unnötig vielen Verfeinerungsschritten, führen.
Abbildung 3.13: Verfeinerte Gitter und numerisch bestimmte duale Lösung zur Berechnung
von ∂1 u(0) auf dem Quadrat bei Verwendung des a posteriori Fehlerschätzers ηweight (uh ) mit
TOL = 4−4 .
148
Testfall 2: Sei nun Ω das Rechteckgebiet Ω = (−1, 1) × (−1, 3) mit Schlitz bei (0, 0) (siehe
Abb. 3.15). Die Präsenz der (einspringenden) scharfen Ecke mit Innenwinkel ω = 2π bewirkt in
der schwachen Lösung eine Eckensingularität“ der Form s = ψ(θ)r 1/2 , d.h. eine Singularität
”
im Gradienten. Wir wollen illustrieren, wie diese Eckensingularität mit der durch die Gewichte
ωT (z) im Fehlerschätzer induzierten zusammenspielt.
Wir sehen in Abb. 3.15, daß der gewichtete Fehlerschätzer Zellen sowohl bei der Schlitzspitze
(zur Unterdrückung des Pollutionseffekts“), aber auch beim Auswertungspunkt konzentriert,
”
während der Energienorm-Fehlerschätzer wesentlich stärker an der Schlitzspitze und natürlich
gar nicht im Auswertungspunkt verfeinert.
"ETA_weight"
"ETA_E"
0.1
"ERROR"
"ETA_weight"
0.01
e_x(-2.,.5)
e_x(-2.,.5)
0.01
0.001
0.001
0.0001
1e-05
0.0001
1000
10000
Number of elements N
100000
1000
10000
Number of elements N
Abbildung 3.14: Vergleich der Effizienz von ηE (uh ) und ηweight (uh ) auf dem Schlitzgebiet.
Abbildung 3.15: Verfeinerte Gitter mit ungefähr 5000 Zellen zur Berechnung von ∂1 u(P ) , erzeugt mit dem gewichteten Fehlerschätzer ηweight (uh ) (mittig) sowie dem Energienorm-Fehlerschätzer ηE (uh ) (rechts).
3.7 Übungen
149
3.7 Übungen
Übung 3.1: Man formuliere das Ritzsche Verfahren mit endlich dimensionalen Teilräumen geeigneter Sobolew-Raume H m (Ω) für die folgenden Aufgabenstellungen:
a) Neumannsche RWA des Laplace-Operators:
−∆u = f in Ω,
∂n u = g auf ∂Ω.
b) Eigenwertproblem des Laplace-Operators:
−∆u = λu in Ω,
u = 0 auf ∂Ω.
c) Dirichletsche RWA des “biharmonischen” Operators:
−∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω.
Dabei seien jeweils das Gebiet Ω sowie die Daten f, g als genügend regulär und kompatibel angenommen. Man versuche, hierfür analog zur Vorlesung “Bestapproximations”-Aussagen
herzuleiten.
Übung 3.2: Seien V ein Hilbert-Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV
und a(·, ·) sowie l(·) bilineare bzw. lineare Formen auf V mit den Eigenschaften
|a(v, w)| ≤ αkvkV kwkV ,
|a(v, v)| ≥ κkvk2V ,
|l(v)| ≤ βkvkV ,
v, w ∈ V
v, w ∈ V
v∈V
(Beschränktheit),
(“V-Elliptizität”),
(Beschränktheit).
Dann hat die Variationsgleichung
a(u, ϕ) = l(ϕ)
∀ϕ ∈ V
nach dem Satz von Lax-Milgram eine eindeutige Lösung u ∈ V . Für endlich dimensionale
Teilräume Vh ⊂ V werden approximative Lösungen uh ∈ Vh bestimmt durch die “GalerkinGleichungen”
a(uh , ϕh ) = l(ϕh ) ϕh ∈ Vh .
a) Man zeige hierfür die (eindeutige) Existenz der “diskreten” Lösungen uh ∈ Vh und die
Fehlerabschätzung
α
inf ku − ϕh kV .
ku − uh kV ≤
κ ϕh ∈Vh
b) Man wende das Resultat von (a) zum Nachweis der Konvergenz der Galerkin-Approximation
des Diffusions-Konvektions-Problems
−∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
auf einem regulären Gebiet Ω ⊂ R2 mit rechter Seite f ∈ L2 (Ω) an.
c) Man versuche das Resultat von (a) für den Fall zu verallgemeinern, daß die Biliearform a(·, ·)
150
nicht V -elliptisch sondern nur “koerzitiv” ist, d.h.:
a(v, ϕ)
≥ γkvk,
ϕ∈V \{0} kϕkV
sup
a(ϕ, v)
≥ γkvk,
ϕ∈V \{0} kϕkV
sup
v ∈ V.
Worin bestehen hierbei die Probleme?
Übung 3.3: Das Modellproblem
−∆u = f in Ω,
u|∂Ω = 0,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einem äquidistanten, kartesischen Gitter mit der
Gitterweite h mit Hilfe der Finite-Elemente-Methode mit stückweise bilinearen Ansatzfunktionen diskretisiert. Man stelle die zugehörigen Systemmatrizen auf:
a) mit exakter Integration,
b) unter Verwendung der 2-dimensionalen “Tensorprodukt-Trapezregel”
4
QT (f ) :=
|T | X
f (ai ),
4
ai Eckpunkte der Zelle T.
i=1
Welche Besonderheit ergibt sich?
Übung 3.4: Man überlege (etwa durch Konstruktion von Beispielen), in wie weit die folgenden
Bedingungen an eine Folge von (im Sinne der Vorlesung regulären) Zerlegungen {Th }h>0 eines
Gebiets Ω ⊂ R2 (in Dreiecke oder Vierecke) äquivalent sind:
a) Die inneren Winkel aller Zellen T ∈ Th sind gleichmäßig für T ∈ Th und h > 0 von Null
wegbeschränkt (“minimum angle condition”).
b) Für die Inkreisradien ρT und Umkreisradien hT der Zellen T ∈ Th gilt (“uniform shape
condition”):
nh o
T
< ∞.
sup
T ∈Th , h>0 ρT
c) Für die Seiten Γ ⊂ ∂T jeder Zelle T ∈ Th gilt
max |Γ| ≤ c min |Γ|
Γ⊂∂T
Γ⊂∂T
mit einer von T unabhängigen Konstante c.
(1)
Übung 3.5: Sei Vh ⊂ H 1 (Ω) der Raum der stückweise linearen finiten Elemente bzgl. einer
regulären Triangulierung von Ω ⊂ R2 . Mit Hilfe des L2 -Skalarprodukts (·, ·) ist die sog. “L2 (1)
Projektion” Ph : L2 (Ω) → Vh definiert durch die Vorschrift
(1)
(Ph u, ϕh ) = (u, ϕh ) ∀ϕh ∈ Vh .
a) Man leite eine Fehlerabschätzung für die L2 -Norm ku − Ph uk her, zunächst unter der Annahme v ∈ H 2 (Ω) . Was würde man unter den schwächeren Regularitätsannahmen v ∈ H 1 (Ω)
3.7 Übungen
151
oder v ∈ L2 (Ω) erhalten?
b) Welche verbesserte Abschätzung erhält man bzgl. der “negativen” Sobolew-Norm
ku − Ph uk−1 :=
(u − Ph u, ϕ)
≤ ch? kvkH 2 ?
k∇ϕk
1
ϕ∈H (Ω)
sup
0
Übung 3.6: Man begründe anhand der eindimensionalen Poisson-Gleichung
−u′′ (x) = f (x) in Ω = (0, 1),
u(0) = u(1) = 0,
(1)
daß für die Ritz-Projektion Rh : H01 (Ω) → Vh eine Abschätzung wie in Aufgabe 6.3b nicht
gelten kann. (Hinweis: Man verifiziere, daß in diesem Fall die Ritz-Projektion Rh u identisch mit
der Knoteninterpolierenden Ih u ist.)
Übung 3.7: Die Dirichletsche Randwertaufgabe
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 werde mit einem Galerkin-Verfahren mit An(1)
satzräumen Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert. Mit welcher
”
Ordnung konvergieren
i) der gewichtete Mittelwert über Ω ( ω ∈ H 1 (Ω) eine glatte Gewichtsfunktion):
Z
Z
uω dx (h → 0) ?
uh ω dx →
Ω
Ω
ii) der quadratischen Mittelwert über einen glatten geschlossenen Weg Γ ⊂ Ω :
Z
Z
u2 ds (h → 0) ?
u2h ds →
Γ
Γ
(Hinweis: Zur Erzielung eines optimalen Resultats verwende man die Variante des Spurlemmas
für Funktionen in H 1,1 (Ω) und die Fehlerabschätzungen aus der Vorlesung.)
Übung 3.8: Man untersuche, ob die folgenden Sätze von Funktionalen für die angegebenen
Polynomräume “unisolvent” sind. Dabei bezeichnen ai die Ecken, mi die Seitenmitten sowie
bij (j = 1, 2) jeweils zwei Gauß-Punkte auf der Kante Γi , i = 1, . . . , d + 1 , und z den Schwerpunkt des Elements T .
i) T (kartesisches) Einheitsdreieck:
P (T ) = P3 (T ),
p(ai ), ∇p(ai ), p(z);
P (T ) = P3 (T ),
p(ai ), p(bij ), p(z);
P (T ) = P5 (T ),
p(ai ), ∇p(ai ), ∇2 p(ai ), ∂n p(mi ).
152
ii) T (kartesisches) Einheitsquadrat:
P (T ) = Q̃1 (T ) := P1 (T ) ⊕ span{x2 − y 2 },
3
3
P (T ) = Q̃3 (T ) := P3 (T ) ⊕ span{x y, xy },
p(mi );
p(ai ), ∇p(ai ).
Übung 3.9: Sei Ω ⊂ R2 ein Polygongebiet und Th = {T } eine Triangulierung von Ω . Man
betrachte die beiden mit den kubischen Ansätzen aus Aufgabe 7.2 gebildeten Ansatzräumen
(3)
(3)
Sh und S̃h und bestimme deren Dimensionen asymptotisch in Abhängigkeit von h auf
gleichmäßigen Triangulierungen. Wieviele von Null verschiedene Elemente haben die zugehörigen
Steifigkeitsmatrizen pro Zeile bei der Approximation der Laplace-Gleichung?
Übung 3.10: Die Neumannsche Randwertaufgabe
−∆u + u = f in Ω,
∂n u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 soll mit einem Galerkin-Verfahren mit Ansatzräumen
(1)
Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert werden.
”
a) Man formuliere diese Approximation, d. h. die Ansatzräume Vh ⊂ V := H 1 (Ω) und die
zugehörigen Variationsgleichungen.
b) Man leite Fehlerabschätzhungen in der H 1 - und der L2 -Norm her.
c) Wie muß dieser Ansatz im Fall eines krumm berandeten Gebiets und einer inhomogenen
Neumann-Randbedingung ∂n u = g auf ∂Ω zur Erzielung einer konformen Approximation
modifiziert werden?
Übung 3.11: Die Randwertaufgabe
−∆u = f in Ω,
u|∂Ω = 0,
auf einem Gebiet Ω ⊂ R2 mit (stückweise) kubisch (z. B. CAD-Daten mit kubischen SplineFunktionen) parametrisiertem C 2 -Rand ∂Ω soll mit einem (isoparametrischen) kubischen FiniteElemente-Ansatz diskretisiert werden. In diesem Fall hat die Lösung mindestens die Regularitätsstufe u ∈ H 3 (Ω) (i. Allg. aber u 6∈ H 4 (Ω) ), und es gilt die a priori Abschätzung
kuk2+k ≤ ck∆ukk ,
k = 0, 1.
a) Man gebe einen geeigneten Ansatzraum an. Welche Konvergenzordnungen sind dafür zu
erwarten bzgl. der Energie-Norm (H 1 -Seminorm) und der L2 -Norm, und welche Regularität
muß dabei jeweils für die Lösung u vorausgesetzt werden?
b) Welche Fehlerordnung läßt sich mit Hilfe eines Dualitätsarguments für die Mittelwerte zeigen,
d. h.:
Z
Z
u
dx
u
dx
−
≤ ch? kuk? ?
h
Ω
Ω
Übung 3.12: Sei T ⊂ R2 ein Dreieck mit Durchmesser hT und Inkreisradius ρT mit hT ≤
cρT , und sei Ih v die lineare Interpolierende mit den Funktionswerten in den Eckpunkten von
3.7 Übungen
153
T als Knotenwerte. Man zeige mit den Mitteln der Vorlesung die Abschätzung
3/2
kv − Ih vk∂T ≤ chT k∇2 vkT .
Hierdurch wird auch die Abschätzung
1/2
kv − Ih vk∂T ≤ chT k∇vkT
nahegelegt. Kann diese gelten?
Übung 3.13: Man gebe die bestmöglichen h-Potenzen in den folgenden Interpolationsfehlerabschätzungen für die Lagrange-Interpolation in P (T ) := P2 (T ) an:
(i)
(ii)
(iii)
(iv)
k∇2 (v − IT v)kT ≤ ci h?T k∇3 vkT ;
|(v − IT v)(a)| ≤ ci h?T k∇3 vkT ;
k∂n (v − IT v)k∂T ≤ ci h? k∇3 vkT ;
kv − IT vkT ≤ ci h?T k∇2 vkT .
Übung 3.14: Zur Finite-Elemente-Approximation des sog. Plattenbiegeproblems” (Randwert”
problem des biharmonischen” Operators)
”
∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω,
wird wieder von einer zugehörigen variationellen Formulierung ausgegangen. Diese ist auf natürliche Weise im Sobolew-Raum V := H02 (Ω) = {v ∈ H 2 (Ω)| u|∂Ω = ∂n u|∂Ω = 0} definiert: Finde
u ∈ V mit
a(u, ϕ) := (∆u, ∆ϕ) = (f, ϕ) ∀ϕ ∈ V.
Die Bilinearform ist a(·, ·) V -elliptisch, so daß die betrachtete RWA eine eindeutige schwache”
”
Lösung u ∈ V besitzt. Auf einem Rechteck Ω ist diese schwache Lösung sogar in H 4 (Ω) und
genügt der a priori Abschätzung
kukH 4 ≤ ckf k.
Für einen konformen Finite-Elemente-Ansatzraum Vh muß nun gelten Vh ⊂ V , d.h.: die stückweise polynomialen Ansatzfunktionen müßen global stetig differenzierbar sein. Das Grundgebiet
Ω sei als konvex polygonal angenommen.
a) Einen konformen Finite-Elemente-Ansatzraum Vh ⊂ V erhält man mit Hilfe des quintischen
Argyris-Elements. Man gebe hierfür eine Fehlerabschätzung in der Energienorm” sowie in der
”
L2 -Norm an. (Hinweis: Dualitätsargument.)
b) Welche Spektral-Kondition in Abhängigkeit von der Gitterweite h ist für die zugehörige
Steifigkeitsmatrix Ah zu erwarten?
Übung 3.15: Die Steifigkeitsmatrix und der Lastvektor eines kubischen FE-Ansatzes zur Approximation der RWA
−∆u = 0 in Ω, u|∂Ω = 0,
auf einer Triangulierung von Ω ⊂ R2 werde mit Hilfe numerischer Quadratur berechnet.
154
a) Von welcher Ordnung sollte die verwendete Quadraturformel sein, damit (i) Konvergenz des
resultierenden Verfahrens bzgl. der Energienorm garantiert ist, und (ii) seine Ordnung optimal
ist? Man gebe jeweils ein Verfahrensbeispiel (Quadraturformel) mit möglichst geringer Komplexität (Anzahl der Funktionsauswertungen) an.
b) Zur Illustration der Notwendigkeit bzw. Nichtnotwendigkeit der in der Vorlesung abgeleiteten
Bedingungen an die numerische Quadratur betrachte man die Approximation der 1. RWA des
Laplace-Operators auf dem Einheitsquadrat mit bilinearen finiten Elementen auf einem äquidistanten, kartesischen Gitter. Welches Differenzenschema erhält man, wenn die Elemente der
Systemmatrix mit der Mittelpunktsregel berechnet werden? Diese Situation ist durch die Theorie
aus der Vorlesung nicht abgedeckt. Ist das resultierende Verfahren dennoch konvergent?
Übung 3.16: Für die Systemmatrix Ah einer Finite-Elemente-Diskretisierung für die 1. RWA
des Laplace-Operators
−∆u = f in Ω, u = 0 auf ∂Ω,
wurde in der Vorlesung für “quasi-gleichförmige” Triangulierungsfolgen (Th )h>0 die Kondition
cond2 (Ah ) = O(h−2 ) gezeigt.
(i) Man rekapituliere, was für eine Triangulierungsfolge “quasi-gleichförmig” bedeutet.
(ii) Wie hängt die Kondition von Ah von den Inkreis- bzw. Inkugelradien der Zellen ab, wenn
die Triangulierungsfolge nicht “formregulär” ist?
(iii) Man untersuche die Abhängigkeit der Kondition der Systemmatrix cond2 (Ah ) der “5Punkte-Differenzendiskretisierung auf äquidistanten Tensorproduktgittern mit unterschiedlichen
Gitterweiten hx 6= hy vom Seitenverhältnis hx /hy (“aspect ratio”). (Hinweis: Man verallgemeinere die in einer früheren Übungsaufgabe hergeleiteten expliziten Formeln für die Eigenwerte
der 5-Punkte-Matrix für die vorliegende Situation.)
Übung 3.17: Man rekapituliere den Beweis der Konditionsabschätzung cond2 (Ah ) = O(h−2 )
aus der Vorlesung für die Systemmatrix einer FE-Diskretisierung der 1. RWA (“Dirichletsche
RWA”) des Laplace-Operators auf einer “quasi-gleichförmigen” Triangulierungsfolge für die FEDiskretisierung der 2. RWA (“Neumannsche RWA”):
−∆u = f in Ω,
∂n u = 0 auf ∂Ω.
Übung 3.18: Es werde die inhomogene Neumannsche RWA
−∇ · (α∇u) + γu = f in Ω,
n · (α∇u) = g auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 betrachtet. Die Daten α , γ , f und g seien glatt
und ferner α, γ > 0 . Mit Hilfe der FEM mit stückweise linearen Ansatzfunktionen wird eine
(1)
Näherung uh ∈ Vh ⊂ H 1 (Ω) berechnet.
a) Man gebe die zugehörige variationelle Formulierung an.
b) Man leite eine a posteriori Fehlerabschätzung für den Energie-Norm-Fehler her:
keh kE := (α∇eh , ∇eh )Ω + (γeh , eh )Ω
1/2
.
c) Man leite eine a posteriori Fehlerabschätzung für den L2 -Norm-Fehler keh k2 her.
3.7 Übungen
155
Übung 3.19: Die 1. RWA des Laplace-Operators auf einem konvexen Polygongebiet Ω ⊂ R2
werde durch lineare” finite Elemente auf einer Triangulierung Th von Ω approximiert. Man
”
zeige, daß die in der Vorlesung abgeleitete a posteriori Abschätzung für den L2 -Norm-Fehler,
ku − uh k2 ≤ c ηL2 (uh )
mit dem Schätzer”
”
ηL2 (uh ) :=
X
T ∈Th
1/2
2
k[∂
u
]k
,
h4T kf + ∆uh k22;T + 21 h−1
n h 2;∂T \∂Ω
T
asymptotisch optimal ist, d.h.:
ηL2 (uh ) ≤ cku − uh k2 +
X
T ∈Th
h4T kf + ∆uh k22
1/2
.
Dazu verwende man die Spur-Abschätzung”
”
−3/2
1/2
k∂n vk2;∂T ≤ chT k∆vk2;T + hT
kvk2;T ,
deren genaue h-Potenzen man mit Hilfe des üblichen Transformationsarguments aus der entsprechenden Ungleichung auf einer Einheitszelle” (Beweisskizze zur Wiederholung) erhält.
”
Übung 3.20: In Anlehnung an die Argumentationsweise der Vorlesung (siehe auch das Skriptum) leite man eine Formel für eine Gitterweitenfunktion h(x) her, welche in folgendem Sinne
“optimal” ist:
N → min!,
η(uh ) ≤ T OL,
wobei
N :=
Z
h(x)−2 dx,
η(uh ) :=
Ω
Z
h(x)2 A(x) dx.
Ω
Übung 3.21: Dem in der vorigen Aufgabe verwendeten Optimierungsargument liegt die Annahme zugrunde, daß sich die Zellresiduen im wesentlichen wie
1/2
ρT := kf + ∆uh kT + 12 hT k[∂n uh ]k∂T = O(hT )
verhalten. Man zeige, daß dies im Fall linearer Ansatzfunktionen auf einer quasi-gleichförmigen (regulär mit “uniform shape”- und “uniform-size”-Eigenschaft) Folge von Triangulierungen
im R2 mit hT ∼ h tatsächlich der Fall ist. Dazu verwende man die bekannte a priori Fehlerabschätzung
k∇(u − uh )k∞ ≤ chk∇2 uk∞
unter der Annahme u ∈ W 2,∞ (Ω) , sowie die gleichfalls bekannten lokalen Interpolationsfehlerabschätzungen und “inversen” Beziehungen für Finite-Elemente-Funktionen. (Bem.: Die Annahme der Quasi-Gleichförmigkeit ist natürlich unrealistisch, da ja im Endeffekt gerade lokal
verfeinerte Gitter erzeugt werden sollen.)
156
4 Iterative Lösungsverfahren für FD- und FE-Gleichungen
In diesem Kapitel werden iterative Lösungsverfahren für die durch Anwendung einer FiniteDifferenzen- oder Finite-Elemente-Diskretisierung entstehenden (linearen) Gleichungssysteme
diskutiert. Dies sind neben den traditionellen Fixpunktiterationen vor allem sog. PCG-Verfahren“
”
(preconditioned conjugate gradient methods) und die modernen Mehrgittermethoden“. Zugrun”
de gelegt wird dabei meist wieder das Modellproblem der 1. RWA des Laplace-Operators
Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(4.0.1)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden
wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form
Ax = b,
(4.0.2)
N
mit Matrizen A = (anm )N
n,m=1 und Vektoren b = (bn )n=1 der Dimension N . In der Praxis
ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger
Aspekt ist. Je nach der gewählten Numerierung der Gitterpunkte bzw. Knoten haben die Matrizen in der Regel Bandstruktur und sind extrem dünn besetzt. Ist das kontinuierliche Problem
selbstadjungiert sowie definit, wie z.B. im Fall der 1. RWA des Laplace-Operators, so übertragen
sich diese Eigenschaften bei FE-Diskretisierungen direkt auf die Systemmatrizen A .
4.1 Krylow-Raum-Methoden
Wir diskutieren jetzt sog. Krylow1 -Raum-Methoden“, zu denen auch das klassische Verfahren
”
der konjugierten Gradienten ( CG-Verfahren“) gehört. Im folgenden werden euklidisches Skalar”
produkt und Norm auf RN mit hx, yi bzw. |x| bezeichnet. Die Koeffizientenmatrix A ∈ RN ×N
sei zunächst als symmetrisch und positiv definit angenommen. Dann läßt sich die Gleichung
(4.0.2) äquivalent charakterisieren durch ein quadratisches Minimierungsproblem:
⇔
Ax = b
Q(x) = min Q(y)
y∈RN
(4.1.3)
mit
Q(y) := 21 hAy, yi − hb, yi.
Wegen ∇2 Q ≡ A folgt aus der Positiv-Definitheit von A die Existenz eines eindeutig bestimmten Minimums von Q(·) , welches notwendig Lösung von (4.0.2) ist. Diese Konstruktion
ist analog zu der beim Nachweis von schwachen“ Lösungen der 1. RWA des Laplace-Operators.
”
Wir halten fest, daß der Gradient von Q in einem Punkt y ∈ Rn gegeben ist durch
∇Q(y) =
1
2
(A + AT )y − b = Ay − b .
(4.1.4)
Dies ist gerade der Defekt“ im Punkt y . Für jede symmetrische, positiv definite Matrix B ∈
”
RN ×N ist durch kykB := hBy, yi1/2 eine sog. Energie-Norm“ definiert. Mit dieser Notation
”
1
Aleksei Nikolaevich Krylov (1863-1945): russischer Mathematiker; Prof. an der Sov. Akademie der Wissensch.
in St. Petersburg; Beiträge zu Fourier-Analysis und Differentialgleichungen, Anwendungen in der Schiffstechnik.
157
158
Iterative Lösungsverfahren für FD- und FE-Gleichungen
gilt dann
2Q(y) = hAy, yi − 2hb, yi
= hAy, yi − hb, yi − hAy, A−1 bi + hb, A−1 bi − hb, A−1 bi
= hAy − b, y − A−1 bi − hb, A−1 bi
= hA−1 (Ay − b), Ay − bi − hb, A−1 bi = |Ay − b|2A−1 − |b|2A−1
= hy − A−1 b, A(y − A−1 b)i − hAA−1 b, A−1 bi = |y − x|2A − |x|2A ,
d.h.: Die Minimierung des Funktionals Q(·) ist äquivalent zur Minimierung der Defektnorm
|Ay − b|A−1 bzw. der Energie-Norm |y − x|A .
Die sog. Abstiegsverfahren“ bestimmen nun ausgehend von einem geeigneten Startvektor
”
x(0) ∈ Rn eine Folge von Iterierten x(t) , t ∈ N , durch
x(t+1) = x(t) + αt d(t) .
(4.1.5)
Dabei sind die d(t) vorgegebene oder auch erst im Verlauf der Iteration berechnete Abstiegs”
richtungen“, und die Schrittweiten“ αt ∈ R sind durch die Vorschrift bestimmt (sog. line
”
”
search“):
Q(x(t+1) ) = min Q(x(t) + αd(t) ) .
(4.1.6)
α∈R
Die notwendige Optimalitätsbedingung
d
Q(x(t) + αd(t) ) = ∇Q(x(t) + αd(t) ) · d(t) = hAx(t) − b, d(t) i + αhAd(t) , d(t) i = 0
dα
ergibt mit dem Residuum r (t) := b − Ax(t) = −∇Q(x(t) ) :
αt =
hr (t) , d(t) i
.
hAd(t) , d(t) i
Das allgemeine Abstiegsverfahren lautet also wie folgt:
Startwert:
für t ≥ 0:
x(0) ∈ RN ,
Iterierte x(t) ,
αt =
Residuum r (t) = b − Ax(t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) .
Praktisch günstiger ist die folgende Schreibweise, bei der man eine Matrix-Vektor-Multiplikation
spart, wenn man den Vektor Ad(t) abspeichert:
Startwert:
für t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Iterierte x(t) ,
αt =
Residuum r (t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die verschiedenen Abstiegsverfahren unterscheiden sich im wesentlichen durch die jeweilige
159
Wahl der Abstiegsrichtungen d(t) . Die einfachste Möglichkeit wäre, die Richtungen d(t) zyklisch
die kartesischen Einheitsvektoren {e(1) , . . . , e(n) } durchlaufen zu lassen. Die so erhaltene iterative Methode wird Koordinatenrelaxation“ genannt. Ein voller Relaxationszyklus ist äquivalent
”
zum Gauß-Seidel-Verfahren (Übungsaufgabe).
Naheliegender ist die Wahl der Richtung des stärksten Abfalls von Q(·) im Punkt x(t) ,
d.h. des Gradienten bzw. Residuums, als Suchrichtung d(t) = −g(t) = −∇Q(x(t) ) = r (t) . Diese
Gradientenverfahren“ ist aber relativ langsam (vergleichbar mit dem Jacobi-Verfahren). Je
”
zwei aufeinander folgende Abstiegsrichtungen sind dabei orthogonal, (d(t+1) , d(t) ) = 0 , aber
d(t+2) braucht nicht einmal annähernd orthogonal zu d(t) zu sein. Dies führt zu einem stark
oszillatorischen Konvergenzverhalten des Gradientenverfahrens besonders bei Matrizen A mit
weit auseinander liegenden Eigenwerten. Dies bedeutet etwa in Fall N = 2 , daß das Funktional
Q(·) stark exzentrische Niveaulinien hat und sich die Iterierten in einem Zickzackkurs der Lösung
annähern (siehe Bild).
Abbildung 4.1: Niveaulinien des quadratischen Funktionals in zwei Dimensionen
4.1.1 Verfahren der konjugierten Richtungen (CG-Verfahren)
Das Gradientenverfahren nutzt die Struktur des quadratischen Funktionals Q(·) , d.h. die Verteilung der Eigenwerte der Matrix A , nur lokal von einem Schritt zum nächsten aus. Es wäre
günstiger, wenn bei der Wahl der Abstiegsrichtungen auch die bereits gewonnenen Informationen
über die globale Struktur von Q(·) berücksichtigt würden, d.h. wenn etwa die Abstiegsrichtungen
paarweise orthogonal wären. Dies ist die Grundidee des sog. Verfahrens der konjugierten Gra”
dienten“ nach Hestenes2 und Stiefel3 ( conjugate gradient method“ oder kurz CG-Verfahren“),
”
”
welches sukzessive eine Folge von Abstiegsrichtungen d(t) erzeugt, die bzgl. des Skalarprodukts
(·, ·)A orthogonal sind ( A-orthogonal“). Zur Konstruktion dieser Folge macht man den Ansatz
”
Kt = span{d(0) , ..., d(t−1) }
und sucht, Iterierte in der Form
x(t) = x(0) +
t−1
X
i=0
αi d(i) ∈ x(0) + Kt
(4.1.7)
zu bestimmen, so daß
Q(x(t) ) = min Q(x(0) + y) .
y∈Kt
2
Magnus R. Hestenes (1906-1991): US-amerikanischer Mathematiker; Prof. an der UCLA, USA, fundamentale
Beiträge u.a. zur Numerischen Linearen Algebra.
3
Eduard Stiefel (1909-1978): schweizer Mathematiker; Prof. an der ETH Zürich; fundamentale Beiträge u.a.
zur Numerischen Linearen Algebra.
160
Dies ist äquivalent zu den Galerkin-Gleichungen“
”
hx(t) − x, d(t) iA = hAx(t) − b, d(j) i = 0,
j = 0, ..., t − 1,
(4.1.8)
bzw. zu r (t) = b − Ax(t) ⊥ Kt . Setzt man den Ansatz (4.1.7) in (4.1.8) ein, so erhält man das
Gleichungssystem
t−1
X
i=0
αi hAd(i) , d(j) i = hb − Ax(0) , dj i,
j = 0, ..., t − 1,
(4.1.9)
mit der regulären Koeffizientenmatrix MA = (hAd(k) , d(j) i)t−1
j,k=0 .
Eine natürliche Wahl der Ansatzräume Kt sind die sog. Krylow-Räume“
”
Kt (r (0) ; A) := span{r (0) , Ar (0) , ..., At−1 r (0) }
zum Residuum r (0) = b − Ax(0) des Startvektors x(0) . Nach Konstruktion ist stets
r (t) = b − Ax(t) = r (0) − r (0) + b − Ax(t)
= r (0) + A(x(0) − x(t) ) ∈ r (0) + AKt (r (0) ; A) ⊂ Kt+1 (r (0) ; A).
Da nach Konstruktion r (t) ⊥ Kt , ist also stets
hr (t) , r (i) i = 0,
i = 0, . . . , t − 1.
Ferner folgt im Fall At r (0) ∈ Kt (r (0) ; A) notwendig r (t) = 0 bzw. Ax(t) = b .
Ausgehend von der Formulierung (4.1.8) konstruiert das CG-Verfahren eine A-orthogonale Folge von Abstiegsrichtungen d(i) , die eine Basis des Krylow-Raumes Kt (r (0) ; A) bildet.
Dies ließe sich etwa mit Hilfe des klassischen Gram4 -Schmidt5 -Algorithmus leisten, was aber
numerisch sehr instabil ist. In Analogie zur vergleichbaren Situation bei der Konstruktion orthogonaler Polynome (z.B. die Legendre6 -Polynome) ist aber zu erwarten, daß dasselbe durch
eine zweistufige Rekursion erreichbar ist.
Ausgehend von einem Startpunkt x(0) mit Residuum (negativer Gradient) r (0) = b − Ax(0)
seien Iterierte x(i) und zugehörige Abstiegsrichtungen d(i) (i = 0, ..., t − 1) bestimmt, so daß
{d(0) , ..., d(t−1) } eine A-orthogonale Basis von Kt (d(0) ; A) ist. Zur Konstruktion des nächsten
4
Jørgen Pedersen Gram (1850-1916): dänischer Mathematiker, Mitarbeiter und später Eigentümer einer Versicherungsgesellschaft, Beiträge zur Algebra (Invariantentheorie), Wahrscheinlichkeitstheorie, Numerik und Forstwissenschaft; das u.a. nach ihm benannte Orthogonalisierungsverfahren geht aber wohl auf Laplace zurück und
wurde bereits von Cauchy 1836 verwendet.
5
Erhard Schmidt (1876-1959): deutscher Mathematiker, Prof. in Berlin, Gründer des dortigen Instituts für
Angewandte Mathematik 1920, nach dem Krieg Direktor des Mathematischen Instituts der Akademie der Wissenschaften der DDR; Beiträge zur Theorie der Integralgleichungen und der Hilbert-Räume sowie später zur
Topologie.
6
Adrien-Marie Legendre (1752-1833): französischer Mathematiker; Mitglied der Pariser Akademie der Wissensch.; Beiträge zur Himmelsmechanik, Zahlentheorie und Geometrie.
161
d(t) ∈ Kt+1 (d(0) ; A) mit der Eigenschaft d(t) ⊥A Kt (d(0) ; A) machen wir den Ansatz
d(t) = r (t) +
t−1
X
j=0
βjt−1 d(j) ∈ Kt+1 (d(0) ; A).
(4.1.10)
Dabei wird o.B.d.A. angenommen, daß r (t) = b − Ax(t) ∈
/ Kt (d(0) ; A) ist, da andernfalls r (t) = 0
(t)
bzw. x = x wäre. Zur Bestimmung der Koeffizienten βjt−1 beachten wir für i = 0, ..., t − 1 :
0 = hd(t) , Ad(i) i = hr (t) , Ad(i) i +
t−1
X
j=0
βjt−1 hd(j) , Ad(i) i = hr (t) + βit−1 d(i) , Ad(i) i .
Für i < t − 1 ist hr (t) , Ad(i) i = 0 wegen Ad(i) ∈ Kt (d(0) ; A) und demnach βit−1 = 0 . Für
i = t − 1 führt die Bedingung
t−1 (t−1)
0 = hr (t) , Ad(t−1) i + βt−1
hd
, Ad(t−1) i
(4.1.11)
zu den Formeln
t−1
βt−1 := βt−1
=−
hr (t) , Ad(t−1) i
,
hd(t−1) , Ad(t−1) i
d(t) = r (t) + βt−1 d(t−1) .
(4.1.12)
Die nächsten Iterierten x(t+1) und r (t+1) = b − Ax(t+1) sind dann bestimmt durch
αt =
hr (t) , d(t) i
,
hd(t) , Ad(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
(4.1.13)
Dies sind die Rekursionsformeln des klassischen CG-Verfahrens. Wegen r (t) ⊥ Kt (r (0) ; A) und
Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } ist
hr (t) , d(i) i = 0,
i = 0, . . . , t − 1.
Damit lassen sich die Formeln für die Koeeffizienten αt und βt vereinfachen. Mit
|r (t) |2 = hd(t) − βt−1 d(t−1) , r (t+1) + αt Ad(t) i = αt hd(t) , Ad(t) i ,
(4.1.14)
|r (t+1) |2 = hr (t) − αt Ad(t) , r (t+1) i = −αt hAd(t) , r (t+1) i .
(4.1.15)
ergibt sich
αt =
|r (t) |2
,
hd(t) , Ad(t) i
βt =
|r (t+1) |2
,
|r (t) |2
(4.1.16)
solange die Iteration nicht mit r (t) = 0 abbricht. Diese Konstruktion führt auf den folgenden
162
CG-Algorithmus:
Startwert:
x(0) ∈ Rn ,
für t ≥ 0:
αt =
r (0) := b − Ax(0) ,
|r (t) |2
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) ,
βt =
|r (t+1) |2
,
|r (t) |2
d(t+1) = r (t+1) + βt d(t) .
In jedem Iterationsschritt ist dabei eine Matrix-Vektor-Multiplikation und fünf Operationen der
Mächtigkeit eines Skalarproduktbildung durchzuführen. Im Falle einer dünn besetzten Matrix
vom Typ der Modellmatrix sind das etwa 10N arithmetische Operationen. Das CG-Verfahren
erzeugt eine Basis von Abstiegsrichtungen, so daß es zwangsläufig nach spätestens t = N − 1
Schritten mit der Lösung x des Gleichungssystems (4.0.2) abbricht. Es handelt sich hierbei
also formal um ein direktes“ Lösungsverfahren. Bei großer Dimension N ≥ 103 geht die A”
Orthogonalität der Folge {d(0) , ..., d(t−1) } wegen des unvermeidlichen Rundungsfehlereinflusses
schnell verloren, und das Verfahren wird zu einem nicht terminierenden, iterativen Prozess.
Außerdem wäre die Durchführung von nahezu N − 1 Iterationsschritten wegen der damit verbundenen Zahl von O(N 2 ) arithmetischen Operationen viel zu hoch. Man wird also mit einer
wesentlich geringeren Anzahl von t ≪ N Schritten auskommen müssen. Wir fassen die wichtigsten Eigenschaften des CG-Verfahrens in folgendem Satz zusammen.
Satz 4.1 (CG-Konvergenz): Das CG-Verfahren bricht für jeden Startvektor x(0) ∈ RN nach
spätestens N −1 Schritten mit x(t) = x ab. Für 0 ≤ t < N −1 gilt die Fehlerabschätzung
1 − 1/√κ t
√
|e(0) |A , t ≥ 1,
(4.1.17)
|e(t) |A ≤ 2
1 + 1/ κ
mit der Spektralkondition κ := κ2 (A) = λmax (A)/λmin (A) von A . Zur Reduzierung des Anfangsfehlers um den Faktor ε sind höchstens
2
1√
κ ln
+1
(4.1.18)
t(ε) ≤
2
ε
Iterationsschritte erforderlich.
Dieses Resultat zeigt die Wichtigkeit der Kondition κ(A) für die Konvergenzgeschwindigkeit des
CG-Verfahrens. Für das Modellproblem ist κ(A) = O(h−2 ) , was eine Gesamtlösungskomplexität
von O(N 3/2 ) bedeutet. Das CG-Verfahren ist daher i.a. ähnlich effizient wie das optimale“
”
SOR-Verfahren, allerdings mit einer größeren Fehlerkonstanten. Im Gegensatz zu letzterem erfordert das CG-Verfahren aber nicht die Bestimmung eines optimalen Relaxationsparameters.
Dafür ist das Resultat (4.1.17) auf den Fall einer symmetrischen, positiv definiten Matrix A
beschränkt.
Beweis: (i) Unter Beachtung der Beziehung
|x(t) − x|A =
min
y∈x(0) +Kt
|y − x|A ,
Kt := Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } = span{A0 r (0) , . . . , At−1 r (0) }
163
finden wir
|x(t) − x|A = min |x(0) − x + p(A)r (0) |A .
p∈Pt−1
Wegen r (0) = b − Ax(0) = A(x − x(0) ) folgt weiter
|x(t) − x|A = min |[I − p(A)A](x(0) − x)|A
p∈Pt−1
≤ min |I + Ap(A)|A |x(0) − x|A ≤
p∈Pt−1
min
p∈Pt , p(0)=1
|p(A)|A |x(0) − x|A ,
wobei die zu der Vektornorm | · |A assoziierte natürliche Matrizennorm der Einfachheit halber
ebenfalls mit | · |A bezeichnet ist. Für beliebiges y ∈ RN haben wir mit einer Orthonormalbasis
{w(1) , . . . , w(N ) } aus Eigenvektoren von A die Entwicklung
y=
N
X
γi w(i) ,
γi = hy, w(i) i ,
i=1
und folglich
|p(A)y|2A
=
N
X
λi p(λi )2 γi2
i=1
wobei
M := sup |p(µ)| ,
≤ M
2
N
X
i=1
λi γi2 = M 2 |y|2A ,
λ := λmin (A), Λ := λmax (A) .
λ≤µ≤Λ
|p(A)|A =
sup
y∈Rn , y6=0
|p(A)y|A
≤ M.
|y|A
(ii) Wir haben gefunden, daß
|x(t) − x|A ≤
min
p∈Pt , p(0)=1
sup |p(µ)| |x(0) − x|A .
λ≤µ≤Λ
Dies ergibt die Behauptung, wenn wir zeigen können, daß
min
p∈Pt , p(0)=1
1 − pλ/Λ t
p
.
sup |p(µ)| ≤ 2
1 + λ/Λ
λ≤µ≤Λ
Dabei handelt es sich um ein Problem der Bestapproximation mit Polynomen bzgl. der Maximumnorm (Tschebyscheff7 -Approximation). Die Lösung p̄ ist gegeben durch
p̄(µ) = Tt
Λ + λ − 2µ Λ−λ
Tt
Λ + λ −1
Λ−λ
,
mit dem t-ten Tschebyscheff-Polynom Tt auf [−1, 1] . Dabei ist
sup p̄(µ) = Tt
λ≤µ≤Λ
Λ + λ −1
Λ−λ
.
7
Pafnuty Lvovich Tschebyscheff (russ.: Chebyshev) (1821-1894): russischer Mathematiker; Prof. in St. Petersburg; Beiträge zur Zahlentheorie, Wahrscjheinlichkeitstheorie und vor allem zur Approximationstheorie; entwickelte allgemeine Theorie orthogonaler Polsynome.
164
Aus der Darstellung
Tt (µ) =
1
2
µ+
p
p
t
t µ2 − 1 + µ − µ2 − 1 ,
µ ∈ (−∞, ∞),
für die Tschebyscheff-Polynome folgt über die Identität
r
√
√
√
κ+1
κ+1
2 κ
( κ ± 1)2
κ±1
κ + 1 2
−1=
±
±
=
= √
κ−1
κ−1
κ−1 κ−1
κ−1
κ∓1
die Abschätzung nach unten
Tt
Also wird
Λ + λ
Λ−λ
= Tt
√
√
√
1 h κ + 1 t κ − 1 t i 1 κ + 1 t
√
√
=
≥
+ √
.
κ−1
2
κ−1
κ+1
2
κ−1
κ + 1
√κ − 1 t
sup p̄(µ) ≤ 2 √
,
κ+1
λ≤µ≤Λ
was (4.1.17) impliziert.
(iii) Zur Herleitung von (4.1.18) fordern wir
√κ − 1 t(ε)
<ε ⇒
2 √
κ+1
Wegen
ln
ist dies erfüllt für t(ε) ≥
x + 1
1√
2
x−1
=2
√κ + 1 −1
ln √
t(ε) > ln
.
ε
κ−1
2
1 1 1
1 1
+
+
+ ...
3
x 3x
5 x5
≥
2
x
κ ln(2/ε) .
Q.E.D.
4.1.2 CG-Verfahren für unsymmetrische und indefinite Probleme
Zur Lösung allgemeiner Gleichungssysteme Ax = b mit einer regulären, aber nicht notwendig
symmetrisch und positiv definiten Matrix A ∈ Rn mit Hilfe des CG-Verfahrens kann man etwa
zu dem äquivalenten System
AT Ax = AT b
(4.1.19)
mit der positiv definiten Matrix AT A übergehen. Hierauf angewendet, schreibt sich das CGVerfahren wie folgt:
Startwerte:
für t ≥ 0:
x(0) ∈ RN ,
αt =
d(0) = r (0) = AT (b − Ax(0) ) ,
|r (t) |2
,
|Ad(t) |2
x(t+1) = x(t) + αt d(t) ,
βt =
|r (t+1) |2
,
|r (t) |2
r (t+1) = r (t) − αt AT Ad(t) ,
d(t+1) = r (t+1) + βt d(t) .
165
Die Konvergenzgeschwindigkeit ist dabei charakterisiert durch κ(AT A) . Das ganze Verfahren
beruht offenbar auf der Minimierung des Funktionals
Q(y) :=
1
2
hAT Ay, yi − hAT b, yi = 21 |Ay − b|2 − 12 |b|2 .
(4.1.20)
Da κ(AT A) ∼ κ(A)2 ist, muß man mit einer recht langsamen Konvergenz dieses quadrierten“
”
CG-Verfahrens für nicht symmetrische Systeme rechnen.
Auf der Basis der Chrakterisierung (4.1.3) ist das beschriebene CG-Verfahren auf symmetrische, positiv definite Matrizen beschränkt. Geht man allerdings von der notwendigen
”
Optimalitätsbedingung“ (4.1.8) aus, so ist dieser Ansatz auch für allgemeine Matrizen sinnvoll. Tatsächlich lassen sich auf diesem Wege leistungsfähige Verallgemeinerungen des CGVerfahrens auch für unsymmetrische und indefinite Matrizen ableiten. Dabei werden in der
Galerkin-Formulierung (4.1.8) als Ansatzräume meist wieder die Krylow-Räume
Kt = span{r (0) , Ar (0) , ..., At−1 r (0) }
verwendet. Als Testräume“ treten gleichfalls Kt∗ = Kt oder auch
”
Kt∗ = span{r (0) , AT r (0) , ..., (AT )t−1 r (0) }
auf. Die resultierenden Verfahren GMRES, ORTHOMIN, CRS, bi-CG-stab u.s.w., haben dann
jeweils die eine oder die andere Eigenschaft des normalen CG-Verfahrens, lassen aber keine so
vollständige Konvergenzanalyse zu.
4.1.3 Vorkonditionierung (PCG-Verfahren)
Die Fehlerabschätzuung für das CG-Verfahren garantiert eine besonders gute Konvergenz, wenn
die Kondition der Matrix A nahe bei Eins liegt. Daher wird eine Vorkonditionierung“ vorge”
nommen, d.h.: Das System Ax = b wird in ein äquivalentes umgeformt, Ãx̃ = b̃ , dessen Matrix
Ã besser konditioniert ist. Sei C eine symmetrische, positiv definite Matrix, welche explizit in
Produktform
C = KK T
(4.1.21)
gegeben ist mit einer regulären Matrix K . Das System Ax = b wird dann in der äquivalenten
Form geschrieben
K −1 A (K T )−1 K T x = K −1 b .
{z
} | {z }
| {z }
|
Ã
x̃
b̃
(4.1.22)
(K T )−1 ÃK T = (K T )−1 K −1 A(K T )−1 K T = C −1 A
(4.1.23)
Das CG-Verfahren wird nun auf das System Ãx̃ = b̃ angewendet. Die Beziehung
zeigt, daß für C ≡ A die Matrix Ã ähnlich zu I, d.h. κ(Ã) = κ(I) = 1 wäre. Folglich wird
man C −1 als möglichst gute Approximation von A−1 wählen, wobei natürlich die Zerlegung
C = KK T bekannt sein muß. Das CG-Verfahren für das transformierte System Ãx̃ = b̃ kann
166
in den ursprünglichen Größen A, b und x als PCG-Verfahren geschrieben werden:
Startwert:
x(0) ∈ RN , d(0) = r (0) = b − Ax(0) ρ(0) = C −1 r (0) ,
für t ≥ 0:
αt =
hr (t) , ρ(t) i
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) ,
ρ(t+1) = C −1 r (t+1) ,
βt =
hr (t+1) , ρ(t+1) i
,
hr (t) , ρ(t) i
d(t+1) = r (t+1) + βt d(t) .
Verglichen mit der einfachen CG-Iteration erfordert das PCG-Verfahren in jedem Schritt zusätzlich die Lösung des Systems Cρ(t+1) = r (t+1) , was unter Ausnutzung der Zerlegung C = KK T
erfolgt. Zur Erzielung einer Komplexität von O(N ) a.Op. pro Schritt sollte die Dreiecksmatrix
K eine ähnliche Besetzungsstruktur wie der untere Dreiecksanteil L von A haben. Ausgehend
von den oben betrachteten einfachen Fixpunktiterationen werden in der Praxis die folgenden
Vorkonditionierer verwendet:
1) Diagonal-Vorkonditionierung (Skalierung): C = D 1/2 D1/2 .
Die Skalierung bewirkt, daß die Elemente von A auf etwa gleiche Größenordnung gebracht
werden, insbesondere wird ãii = 1 . Dies reduziert die Kondition, denn es gilt:
κ(A) ≥
max1≤i≤N aii
.
min1≤i≤N aii
(4.1.24)
Beispiel: Die Matrix A = diag{λ1 = ... = λN −1 = 1, λN = 10k } hat die Kondition cond2 (A) =
10k . Die skalierte Matrix Ã = D−1/2 AD −1/2 hat dagegen die optimale Kondition cond2 (Ã) = 1 .
2) SSOR-Vorkonditionierung:
Mit einem Parameter ω wird gesetzt
1/2
1/2
+ {z
ωD −1/2 R}) .
C = (D + ωL)D −1 (D + ωR) = (D
+ {z
ωLD −1/2})(D
|
|
K
KT
Offenbar besitzt die Dreiecksmatrix K dieselbe schwache Besetzung wie A . Pro Iterationsschritt
erfordert das so vorkonditionierte Verfahren etwa doppelt so viel Aufwand wie das einfache
Verfahren. Dagegen gilt für die Modellmatrix bei optimaler Wahl des Parameters ω (i.a. nicht
leicht zu bestimmen!)
p
κ(Ã) = κ(A) .
3) ICCG-Verfahren (Incomplete Cholesky Conjugate Gradient):
Die symmetrische, positiv definite Matrix A besitzt eine Cholesky-Zerlegung A = LLT mit
einer unteren Dreiecksmatrix L = (lij )N
i,j=1 . Die Elemente von L sind bestimmt durch die
167
Rekursionsformeln
lii =
lji =
aii −
i−1
X
2
lik
k=1
i−1
X
1
aji −
lii
k=1
1/2
,
ljk lik ,
i = 1, . . . , N ,
j = i + 1, . . . , N .
Die Matrix L hat i.a. innerhalb der Hülle von A von Null verschiedene Elemente, erfordert also
in der Regel weit mehr Speicherplatz als A selbst. Dies wird jedoch dadurch ausgeglichen, daß
man nur eine ”unvollständige Cholesky-Zerlegung” vornimmt, d.h.: Im Cholesky-Algorithmus
werden einige der lji willkürlich Null gesetzt, z.B.: ˜lji = 0 , wenn aji = 0 . Dies ergibt dann
eine Zerlegung
A = L̃L̃T + E
(4.1.25)
mit einer unteren Dreiecksmatrix L̃ = (˜lij )i,j=1,...,N , welche eine ähnliche (dünne) Besetzungsstruktur wie A besitzt. Man spricht von der ICCG(0)-Variante, wenn (4.1.25) gefordert wird.
Werden im Fall einer Bandmatrix A weitere p Nebendiagonalen mit von Null verschiedenen Elementen in L̃ hinzugefügt bzw. weggestrichen, so nennt man dies die ICCG(+p) bzw.
ICCG(−p)-Variante. Zur Vorkonditionierung verwendet die ICCG-Methode die Matrix
C = KK T = L̃L̃T .
(4.1.26)
Obwohl keine strenge theoretische Begründung für den Erfolg dieses Ansatzes vorliegt, so zeigen doch numerische Tests an Modellproblemen, welchen Einfluß diese Konditionierung auf die
Verteilung der Eigenwerte der Matrix Ã hat. Zwar wird die Konditionszahl κ(Ã) nicht deutlich kleiner als κ(A) , doch die Eigenwerte von Ã häufen sich im Gegensatz zu denen von A
stark bei λ = 1 . Dies bewirkt, wie eine feinere Analyse zeigt, eine deutliche Beschleunigung der
Konvergenz.
4) ADI-Vorkonditionierung: C = (Ax + ωI)(Ay + ωI)(ATy + ωI)(ATx + ωI) .
Auch hier muß zur Bewahrung der Symmetrie von Ã eine symmetrisierte Variante des ADIMatrix verwendet werden.
Eine gute Vorkonditionierung der Modellmatrix bewirkt eine Verbesserung der Konvergenzrate von ρ(A) = 1 − O(h) auf ρ(Ã) = 1 − O(h1/2 ) und damit auf die Lösungskomplexität
O(N 5/4 ) . Besonders die ILU-Vorkonditionierung hat sich in der Praxis bei vielen Problemen als
effizient und robust erwiesen. Sie reduziert zwar nicht die Kondition, doch bewirkt eine Konzentration der Eigenwerte um den Wert λ = 1 , was ebenfalls eine deutliche Beschleunigung der
CG-Konvergenz mit sich bringt.
168
4.2 Mehrgitterverfahren
Mehrgitterverfahren gehören zum Typ der (verallgemeinerten) Defektkorrekturiterationen und
verwenden eine Folge von Subproblemen ähnlicher Struktur, aber sukzessive kleiner werdender Dimension. Sie sind speziell zugeschnitten auf die Lösung der Gleichungssysteme, wie sie
bei der Diskretisierung partieller Differentialgleichungen mit Differenzen- oder Finite-ElementeVerfahren entstehen. Die Idee ist die eines allen diskreten Problemen zugrunde liegenden übergeordneten, kontinuierlichen Problems und der fortgesetzten Aufspaltung von Fehlern und Defekten auf den verschiedenen Gittern in niedrig- und hochfrequente Anteile, die separat behandelt
werden. Bei richtiger Zusammenstellung der einzelnen Verfahrenskomponenten erhält man Idealfall das gewünschte optimale“ Lösungsverfahren der Komplexität O(N ) .
”
Zum Einstieg betrachten wir das Gleichungssystem auf dem Gitter Th :
Ah xh = bh
(4.2.27)
und approximieren die Lösung mit dem Richardson-Verfahren
(t+1)
xh
(t)
(t)
(t)
= xh + θh (bh − Ah xh ) = (Ih − θh Ah )xh + θh bh
(4.2.28)
mit einem Dämpfungsfaktor 0 < θh ≤ 1 . Die symmetrische, positiv definite Matrix Ah besitzt
(i)
ein Orthonormalsystem von Eigenvektoren {wh , i = 1, ..., Nh } zu den geordneten Eigenwerten
λmin (Ah ) = λ1 ≤ ... ≤ λN = λmax (Ah ) =: Λh . Entwickelt man den Anfangsfehler in der Form
(0)
eh
:=
(0)
xh
− xh =
Nh
X
(i)
εi wh ,
i=1
so gilt für die iterierten Fehler entsprechend
(t)
eh
= (Ih −
(0)
θh Ah )t eh
=
Nh
X
i=1
t
εi (Ih − θh Ah )
(i)
wh
=
Nh
X
i=1
(i)
εi (1 − θh λi )t wh .
Folglich ist
(t)
|eh |2
=
Nh
X
i=1
ε2i (1 − θh λi )2t .
(4.2.29)
Die Bedingung 0 < θh ≤ Λ−1
ist hinreichend für die Konvergenz der Richardson-Iteration.
h
Wegen |1 − θh λi | ≪ 1 für große λi und |1 − θh λ1 | ≈ 1 werden offenbar hoch-frequente“
”
Komponenten des Fehlers sehr schnell, aber niedrig-frequente“ nur sehr langsam gedämpft.
”
(t)
(t)
(t)
Dasselbe gilt auch für das Residuum rh = bh − Ah xh = Ah eh , d.h.: Bereits nach wenigen
Iterationen gilt:
[N/2]
(t)
|rh |2
≈
X
i=1
ε2i λ2i (1 − θh λi )2t ,
(4.2.30)
wobei [N/2] := max{n ∈ N| n ≤ N/2} ist. Dies kann so interpretiert werden, daß der iterierte
(t)
Defekt rh auf dem Gitter Th glatt ist. Daher sollte er auf einem gröberen Gitter T2h mit Git-
169
terweite 2h gut approximierbar sein. Die resultierende Defektgleichung zur Berechnung der Kor(t)
rektur zur Näherung xh auf Th würde dann wegen ihrer geringeren Dimension N2h ≈ Nh /4
auch weniger Aufwand kosten. Dieser Defektkorrekturproze in Verbindung mit sukzessiver Vergröberung kann weitergeführt werden bis zu einem gröbsten Gitter, auf dem die Defektgleichung
dann exakt gelöst wird. Die wichtigsten Bestandteile eines solchen Mehrgitterprozesses sind die
(0)
(ν)
Glättungsiteration“ xh = Shν (xh ) sowie geeignete Transferoperationen zwischen den Finite”
Elemente-Räumen auf den verschiedenen Gittern. Die Glättungsoperation Sh (·) ist gewöhnlich
gegeben in Form einer Fixpunktiteration (z.B. der Richardson-Iteration)
(ν+1)
xh
(ν)
(ν)
= Sh (xh ) := (Ih − Ch−1 Ah )xh + Ch−1 bh ,
mit der Iterationsmatrix Sh := Ih − Ch−1 Ah .
4.2.1 Mehrgitteralgorithmus im Finite-Elemente-Kontext
Zur Formalisierung des Mehrgitterprozesses betrachten wir nun eine Folge von Gittern Tl =
Thl , l = 0, ..., L , zunehmender Feinheit h0 > ... > hl > ... > hL sowie zugehörige FE-Räume
Vl := Vhl ⊂ V . Der Einfachheit halber sei angenommen, daß die FE-Räume hierarchisch geordnet sind, d.h.: V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL . Diese Voraussetzung erleichtert die Analyse des
Mehrgitterprozesses, ist aber nicht entscheidend für sein Funktionieren. Zwischen den Funktionen vl ∈ Vl und den zugehörigen Knotenwertevektoren yl ∈ RNl gilt der übliche Zusammenhang vl (an ) = yl,n , n = 1, ..., Nl . Wie üblich schreiben wir das kontinuierliche Problem und sein
FE-Analogon in kompakter Form als
a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V,
(4.2.31)
bzw. auf dem feinsten Gitter TL als
a(uL , ϕL ) = (f, ϕL ) ∀ϕL ∈ VL .
(4.2.32)
Dabei sind a(u, ϕ) := (Lu, ϕ) die zum (elliptischen) Operator L gehörende “Energie-Form“ und
(f, ϕ) das L2 -Skalarprodukt auf dem Lösungsgebiet Ω . Die exakte“ diskrete Lösung uL ∈ VL
”
genügt der a priori Fehlerabschätzung
ku − uL k ≤ c h2L kf k .
(4.2.33)
Ziel ist es, einen Lösungsprozess zu finden, der eine Approximation ũL ≈ uL liefert mit
kuL − ũL k ≤ c h2L kf k.
(4.2.34)
Ist der dazu erforderliche Aufwand O(NL ) und zwar gleichmäßig bzgl. L , so nennt man diesen
Prozess komplexitäts-optimal“. Wir werden sehen, daß der Mehrgitteralgorithmus bei richtiger
”
Wahl der Verfahrenskomponenten in diesem Sinne optimal“ ist.
”
(0)
Sei uL ∈ VL eine Schätzung für die exakte Lösung uL ∈ VL auf Gitterlevel L . Zunächst
(0)
(0)
(0)
wird uL geglättet“. Dazu werden ausgehend von ūL := uL z.B. ν Schritte des Richardson”
Verfahrens durchgeführt. In variationeller Schreibweise lautet dies:
(k)
(k−1)
(ūL , ϕL ) = (ūL
(k−1)
, ϕL ) + θL (f, ϕL ) − a(ūL
, ϕL )
∀ϕL ∈ VL ,
(4.2.35)
170
wobei θL = λmax (Ah )−1 . Mit der geglätteten Approximation wird der Defekt dL ∈ VL gebildet
(ohne ihn wirklich zu berechnen):
(ν)
(dL , ϕL ) := (f, ϕL ) − a(ūL , ϕL ),
ϕL ∈ VL .
(4.2.36)
Wegen VL−1 ⊂ VL erhält man auf dem nächst gröberen Gitter TL−1 die Defektgleichung
( Grobgittergleichung“)
”
(ν)
a(qL−1 , ϕL−1 ) = (dL , ϕL−1 ) = (f, ϕL−1 ) − a(ūL , ϕL−1 ) ∀ϕL−1 .
(4.2.37)
Die Korrektur qL−1 ∈ VL−1 wird nun entweder exakt berechnet (etwa mit einem direkten“
”(R)
(0)
Löser) oder nur näherungsweise mit Hilfe einer Defektkorrekturiteration qL−1 → qL−1 unter
(R)
Verwendung der noch gröberen Gitter TL−2 , ..., T0 . Das Ergebnis qL−1 ∈ VL−1 wird dann als
(ν)
Element von VL interpretiert und zur Korrektur von ūL
verwendet:
(R)
(ν)
¯(0)
ū
L := ūL + ωL qL−1 .
(4.2.38)
¯L zu
Dabei wird der Dämpfungsparameter ωL ∈ (0, 1) verwendet, um das Residuum von ū
minimieren. Auf diesen in der Praxis sehr nützlichen Trick wollen wir hier nicht weiter eingehen.
¯L wird nun nochmals µ-mal nachgeglättet“. Ausgehend
Die erhaltene korrigierte Näherung ū
”
(0)
¯
¯
von ūL := ūL wird etwa wieder mit dem Richardson-Verfahren iteriert:
(k)
(k−1)
¯L , ϕL ) = (ū
¯L
(ū
¯(k−1)
, ϕL ) + θL (f, ϕL ) − a(ū
, ϕL )
L
∀ϕL ∈ VL .
(1)
(4.2.39)
(µ)
¯L akzeptiert. Damit
Das Ergebnis wird schließlich als die nächste Mehrgitteriterierte uL := ū
haben wir einen Schritt des Mehrgitterverfahrens (einen Zyklus“) auf dem Gitterlevel L be”
schrieben. Jeder solche Zyklus beinhaltet also neben ν + µ Richardson-Schritten (auf Level L),
welche jeweils eine Inversion der Massematrix erfordern, die Lösung des Grobgitterproblems“
”
(4.2.37).
Wir wollen nun den beschriebenen Mehrgitteralgorithmus in etwas abstrakterer Form darstellen, um seine Struktur besser zu verstehen und ihn auch leichter analysieren zu können. Zu
den Matrizen Al = Ahl auf den Gittern Tl sind Operatoren Al : Vl → Vl assoziiert durch
(Al vl , wl ) = a(vl , wl ) = hAl yl , zl i ∀vl , wl ∈ Vl .
(4.2.40)
Weiter seien Sl (·) die zugehörigen Glättungsoperationen mit (linearen) Iterationsoperatoren
Sl . Beim Richardson-Verfahren ist der Iterationsoperator Sl = Il − θl Al . Schließlich führen wir
noch Transferoperatoren zwischen aufeinander folgenden Räumen ein:
rll−1 : Vl → Vl−1 (Restriktion),
pll−1 : Vl−1 → Vl (Prolongation).
Im Finite-Elemente-Kontext ist natürlicherweise rll−1 = Pl−1 die L2 -Projektion und pll−1 =
id. die natürliche Einbettung. Wir beschreiben nun den Mehrgitterprozeß zur Berechnung der
Lösung des Sytems
A L uL = f L
auf dem feinsten“ Gitter TL .
”
(4.2.41)
171
(t)
(0)
Mehrgitterprozeß: Ausgehend von einem Startwert uL ∈ VL werden Iterierte uL durch den
folgenden rekursiven Prozeß
(t)
(t+1)
= M G(L, uL , fL )
uL
(4.2.42)
(t)
erzeugt. Sei also die t-te Mehrgitteriterierte uL bestimmt.
Grobgitterlösung: Für l = 0 bedeutet M G(0, ·, g0 ) stets die exakte Lösung des Systems A0 v0 =
g0 (z.B. mit Hilfe eines direkten Lösungsverfahrens), d.h.:
v0 = M G(0, ·, g0 ) = A−1
0 g0 .
(4.2.43)
Rekursion: Sei für ein 1 ≤ l ≤ L das System Al vl = gl zu lösen. Mit Parameterwerten ν, µ ≥ 1
ist dann
(1)
(0)
M G(l, vl , gl ) := vl
≈ vl
(4.2.44)
rekursiv definiert durch die folgenden Schritte:
(i) Vorglättung:
(0)
v̄l := Slν (vl ) ;
(4.2.45)
dl := gl − Al v̄l , ;
(4.2.46)
d˜l−1 := rll−1 dl ;
(4.2.47)
(ii) Defektbildung:
(iii) Restriktion:
(0)
(iv) Defektgleichung: Ausgehend von ql−1 := 0 wird für 1 ≤ r ≤ R iteriert:
(r−1)
(r)
ql−1 := M G(l − 1, ql−1 , d˜l−1 ) ;
(4.2.48)
(4.2.49)
(v) Prolongation:
(R)
ql := pll−1 ql−1 ;
(4.2.50)
(vi) Korrektur: Mit einem Dämpfungsparameter ωl ∈ (0, 1] wird gesetzt:
v̄¯l := v̄l + ωl ql ;
(4.2.51)
(vii) Nachglättung:
(1)
vl
:= Slµ (v̄¯l ) ;
(4.2.52)
172
Im Falle l = L wird schließlich gesetzt:
(t+1)
uL
(1)
:= vl
.
(4.2.53)
(t+1)
(t)
Schematische Darstellung des Mehrgitterschritts uL → uL
(t)
(t)
(t)
:
(t)
uL → ūL = SLν (uL ) → dL = fL − AL ūL
↓ d˜L−1 = rLL−1 dL−1
˜
qL−1 = Ã−1
L−1 dL−1
(Restriktion)
(R-malige Defektkorrektur)
↓ q̃L = pL
L−1 qL−1
(Prolongation)
(t+1)
(t)
¯(t)
¯(t)
= SLµ (ū
ū
L )
L = ūL + ωL q̃L → uL
Wenn die Defektgleichung AL−1 qL−1 = d˜L−1 auf dem gröberen Gitter TL−1 exakt“ gelöst wird
”
(z.B. durch Gauß-Elimination), spricht man von einer Zweigittermethode“: In der Regel wird
”
der Prozeß aber rekursiv zum Mehrgitterverfahren bis zum gröbsten Gitter fortgesetzt. Dabei
kann der vollständige Mehrgitterzyklus auf verschiedene Art organisiert werden. Seine Struktur
ist im wesentlichen durch den Parameter R bestimmt, der festlegt, wie oft der Defektkorrekturprozeß auf jedem Gitterlevel durchgeführt wird. In der Praxis spielen nur die Fälle R = 1 oder
R = 2 eine Rolle. Dem entsprechen der im schematischen Bild gezeigte sog. V-Zyklus“ und
”
der sog. W-Zyklus“. Dabei stehen die Punkte •“ für Glättung und Defektkorrektur auf den
”
”
Gittern Tl , und die Linie −“ für den Transfer zwischen aufeinander folgenden Gitterniveaus.
”
v4
v3
v2
v1
v0
v4
v3
v2
v1
v0
Abbildung 4.2: Schema eines Mehrgitterverfahrens mit V- (oben links) F- (oben rechts) und
W-Zyklus (unten).
Der V-Zyklus ist sehr effizient (wenn er funktioniert), krankt aber oft an Instabilitäten,
welche durch Irregularitäten im Problem (starke Unsymmetrien, Eckensingularitäten, Gitterunregelmäßigkeiten u.s.w.) hervorgerufen werden. Der W-Zyklus ist dagegen sehr robust, aber auch
173
teurer. Methoden mit R ≥ 3 sind gewöhnlich zu ineffizient. Ein guter Kompromiß zwischen VZyklus und W-Zyklus stellt der sog. F-Zyklus“ dar. Dieser wird gewöhnlich auf Gitter TL
”
(0)
(0)
gestartet mit einem beliebigen Startvektor uL (meist uL = 0 ). Wird dieser Prozeß allerdings
zur Lösung eines nicht linearen Problems im Rahmen einer Newton-Iteration angewendet, so
kann dieser Startwert zu ungenau sein, und die ganze Iteration divergiert. In einem solchen Fall
startet man zur Generierung einer hinreichend genauen Anfangsapproximation den Mehrgitterprozess gewöhnlich auf dem gröbsten Gitter T0 . Wir beschreiben dieses sog. geschachtelte“
”
Mehrgitter-Schema ( nested multigrid“) für das lineare Problem.
”
Geschachteltes MG: Ausgehend von dem Startwert u0 := A−1
0 f0 auf dem gröbsten Gitter T0
werden für l = 1, ..., L rekursiv Näherungen ũl ≈ ul berechnet nach der Vorschrift:
(0)
ul
= pll−1 ũl−1
(t)
(t−1)
ul = M G(l, ul
, fl ),
t = 1, ..., tl ,
(t )
(tl )
kul
− ul k ≤ ĉ h2l kf k,
ũl = ul l .
Es gibt nicht den“ Mehrgitteralgorithmus. Die erfolgreiche Realisierung des Mehrgitterkon”
zepts erfordert eine sorgfältige Balance der verschiedenen Bestandteile wie Glätter Sl und Gitteroperatoren Al sowie der Gittertransfers rll−1 und pll−1 jeweils für das zu lösende Problem. Im
folgenden werden wir diese Verfahrenskomponenten im Rahmen des Finite-Elemente-Kontexts
diskutieren.
i) Glätter:
Glätter“ sind üblicherweise einfache Fixpunktiterationen, die auch als Löser“
”
”
verwendet werden können, aber mit einer sehr schlechten Konvergenzrate. Sie werden auf jedem
Gitterniveau nur ein paarmal angewendet (ν, µ ∼ 1 − 4), um die hochfrequenten Fehleranteile
auszudämpfen. Wir betrachten im folgenden nur das klassische Richardson-Verfahren,
Sl := Il − θl Al ,
θl = λmax (Al )−1 ,
(4.2.54)
welches aber nur bei sehr gutartigen“ Problemen funktioniert. Leistungsfähiger und robuster
”
sind das Gauß-Seidel- und das ILU-Verfahren. Diese funktionieren auch noch gut, wenn das
Problem gewisse Pathologien beinhaltet. Im Fall eines starken Advektionsterms besitzt die Systemmatrix bei Numerierung der Knotenpunkte in Transportrichtung einen dominanten unteren
Dreicksanteil L , für den die Gauß-Seidel-Methode exakt“ ist. Für Probleme mit degenerierten
”
Koeffizienten in einer Raumrichtung sowie auf stark anisotropen Gittern besitzt die Systemmatrix einen dominaten Tridiagonalanteil, für den wiederum die ILU-Iteration exakt ist. Für echt
indefinite Probleme werden spezielle, der jeweiligen Struktur des Problems angepaßte Glätter
verwendet, deren Diskussion aber außerhalb des Rahmens dieser Vorlesung liegt. Auf lokal verfeinerten Gittern darf die Glättung im Wesentlichen nur auf den jeweils neu hinzugekommenen
Zellen operieren, da sonst der arithmetische Aufwand pro Gitterlevel zu groß wird.
ii) Gittertransfers: Im Kontext einer Finite-Elemente-Diskretisierung mit geschachtelten Ansatzräumen V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL ist die generische Wahl für die Prolongation
pll−1 : Vl−1 → Vl die zellweise Einbettung und für die Restriktion rll−1 : Vl → Vl−1 die L2 Projektion. Bei anderen Diskretisierungen (z.B. Differenzenschemata) verwendet man geeignete
Interpolationsprozesse (z.B. bilineare Interpolation).
iii) Grobgitteroperatoren: Die Operatoren Al auf den verschiedenen Gitterniveaus müssen nicht
notwendig zur selben Diskretisierung des Ausgangsproblems gehören. Dies wird z.B. wichtig
174
bei der Berücksichtigung von gitterweitenabhängiger künstlicher Diffusion ( upwinding“) zur
”
Behandlung von Transporttermen. Wir beschränken uns hier aber auf den Idealfall, daß alle
Al durch dieselben FE-Diskretisierungen auf der Gitterhierarchie {Tl }l=0,...,L erzeugt sind. In
diesem Fall gilt die für die theoretische Analyse nützliche Beziehung
(Al−1 vl−1 , wl−1 ) = a(vl−1 , wl−1 )
= a(pll−1 vl−1 , pll−1 wl−1 )
= (Al pll−1 vl−1 , pll−1 wl−1 ) = (rll−1 Al pll−1 vl−1 , wl−1 ) ,
d.h.: Al−1 = rll−1 Al pll−1 .
iv) Korrekturschritt: Im Korrekturschritt wird ein Dämpfungsparameter ωl ∈ (0, 1] verwendet,
der im einfachsten Fall ωl = 1 gesetzt ist. Es hat sich als sehr wirksam erwiesen, ihn so zu
wählen, daß der Defekt Al v̄¯l − d˜l−1 minimal wird. Dies führt auf die Formel
ωl =
(Al v̄¯l , d˜l−1 − Al v̄¯l )
.
kAl v̄¯l k2
(4.2.55)
In der folgenden Analyse werden wir der Einfachheit halber stets ωl = 1 setzen.
4.2.2 Konvergenz- und Aufwandsanalyse
Die klassische Analyse des Mehrgitteralgorithmus basiert auf seiner Interpretation als eine Defektkorrekturiteration und dem Konzept einer rekursiven Anwendung des Zweigitterverfahrens.
Zur Vereinfachung nehmen wir an, daß nur Vorglättung angewendet wird (d.h.: ν > 0, µ = 0)
und daß im Korrekturschritt keine Dämpfung erfolgt (d.h.: ωl = 1 ). Der Zweigitterprozeß läßt
sich dann in der folgenden Form schreiben:
(t+1)
uL
(t)
(t) −1 L−1
= SLν (uL ) + pL
fL − AL SLν (uL )
L−1 AL−1 rL
(t)
−1 L−1
ν (t)
= SLν (uL ) + pL
L−1 AL−1 rL AL uL − SL (uL ) .
(t)
(t)
Für den Iterationsfehler eL := uL − uL gilt daher
(t+1)
eL
ν (t)
−1 L−1
= I L − pL
L−1 AL−1 rL AL SL (uL ) − uL .
(4.2.56)
Die Glättungsoperation ist gegeben in der (affin-linearen) Form
SL (vL ) := SL vL + gL
und erfüllt als Fixpunktiteration die Bedingung SL (uL ) = uL . Daraus erschließt man rekursiv,
daß
(t)
(t)
(t)
SLν (uL ) − uL = SL SLν−1 (uL ) − uL = ... = SLν eL .
Mit dem sog. Zweigitteroperator“
”
−1 L−1
ν
ZGL (ν) := (IL − pL
L−1 AL−1 rL AL )SL
175
gilt daher
(t+1)
eL
(t)
= ZGL (ν)eL .
(4.2.57)
Satz 4.2 (Zweigitterkonvergenz): Für hinreichend häufige Glättung, ν > 0 , ist der Zweigitteralgorithmus konvergent mit einer bzgl. L gleichmäßigen L2 -Konvergenzrate:
kZGL (ν)k ≤ ρZG (ν) = c ν −1 < 1 .
(4.2.58)
ν
L
−1 L−1
ZGL (ν) = (A−1
L − pL−1 AL−1 rL )AL SL
(4.2.59)
−1 L−1
ν
L
kZGL (ν)k ≤ kA−1
L − pL−1 AL−1 rL kkAL SL k .
(4.2.60)
Beweis: Wir schreiben
und schätzen ab:
Der erste Term rechts beschreibt die Qualität der Approximation der Feingitterlösung auf dem
gröberen Gitter, während der zweite Term den Glättungseffekt enthält. Die Idee für die weitere
Analyse ist nun, zu zeigen, daß der Glätter SL (·) die sog. Glättungseigenschaft“,
”
kAL SLν vL k ≤ cs ν −1 h−2
L kvL k ,
vL ∈ VL ,
(4.2.61)
und die Grobgitterkorrektur die sog. Approximationseigenschaft“ besitzt,
”
−1 L−1
2
L
k(A−1
L − pL−1 AL−1 rL )vL k ≤ ca hL kvL k ,
vL ∈ VL ,
(4.2.62)
mit positiven Konstanten cs , ca gleichmäßig bzgl. L . Kombination dieser beiden Abschätzungen
ergibt dann die behauptete Ungleichung (4.2.58). Für hinreichend häufige Glättung ist ρZG :=
cν −1 < 1 , und der Zweigitteralgorithmus konvergiert gleichmäßig bzgl. L . Alle im folgenden
auftretenden Konstanten sind unabhängig von L .
(i) Glättungseigenschaft: Der selbstadjungierte Operator Al besitzt reelle, positive Eigenwerte
0 < λ1 ≤ ... ≤ λi ≤ ... ≤ λNL =: ΛL mit einem zugehörigen L2 -Orthonormalsystem von
Eigenfunktionen {w(1) , ..., w(NL ) } , so daß sich jedes vL ∈ VL in der Form
vL =
NL
X
γi w(i) ,
γi = (vL , w(i) )
(4.2.63)
i=1
darstellen läßt. Für den Richardson-Iterationsoperator
SL := IL − θL AL : VL → VL ,
θL = Λ−1
L ,
(4.2.64)
gilt dann
AL SLν vL =
NL
X
i=1
λi ν (i)
w ,
γi λi 1 −
ΛL
(4.2.65)
176
und folglich
kAL SLν vL k2 =
NL
X
i=1
λi 2ν
γi2 λ2i 1 −
ΛL
NL
λi 2ν o X
γi2
1≤i≤NL
ΛL
ΛL
i=1
n λ 2 2ν o
λ
i
i
= Λ2L max
1−
kvL k2 .
1≤i≤NL
ΛL
ΛL
≤ Λ2L max
n λ 2 i
1−
Mit Hilfe der Beziehung (Übungsaufgabe)
max {x2 (1 − x)2ν } ≤ (1 + ν)−2
(4.2.66)
kAL SLν vL k2 ≤ Λ2l (1 + ν)−2 kvL k2 .
(4.2.67)
0≤x≤1
ergibt sich
Die Beziehung ΛL ≤ ch−2
L liefert dann schließlich die behauptete Ungleichung für den RichardsonIterationsoperator
kAL SLν k ≤ cs ν −1 h−2
L ,
ν ≥ 1.
(4.2.68)
(ii) Approximationseigenschaft: Wir erinnern daran, daß im vorliegenden Kontext geschachtelter
FE-Räume Prolongationen und Restriktionen gegeben sind durch
pL
L−1 = id. (Identität),
rLL−1 = PL−1 (L2 -Projektion).
Ferner erfüllt der Operator AL : VL → VL definitionsgemäß
(AL vL , ϕL ) = a(vL , ϕL ),
vL , ϕL ∈ VL .
Für ein beliebiges, aber fest gewähltes fL ∈ VL gilt demnach für die Funktionen vL := A−1
L fL
−1 L−1
und vL−1 := AL−1 rL fL :
a(vL , ϕL ) = (fL , ϕL ) ∀ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) ∀ϕL−1 ∈ VL−1 .
Der Funktion vL ∈ VL ordnen wir eine Funktion v ∈ V ∩ H 2 (Ω) zu als Lösung der Randwertaufgabe
Lv = fL in Ω,
v = 0 auf ∂Ω,
(4.2.69)
bzw. in schwacher“ Formulierung
”
a(v, ϕ) = (fL , ϕ)
∀ϕ ∈ V .
(4.2.70)
177
Dafür gilt die a priori Abschätzung
k∇2 vk ≤ ckfL k.
(4.2.71)
Dann ist
a(vL , ϕL ) = (fL , ϕL ) = a(v, ϕL ),
ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) = a(v, ϕL−1 ),
ϕL−1 ∈ VL−1 ,
d.h.: vL und vL−1 sind gerade die Ritz-Projektionen von v auf VL bzw. VL−1 . Für diese gelten
die L2 -Fehlerabschätzungen
kvL − vk ≤ ch2L k∇2 vk,
kvL−1 − vk ≤ ch2L−1 k∇2 vk.
(4.2.72)
Damit erhalten wir wegen hL−1 ≤ 4hL und der a priori Abschätzung (4.2.71):
kvL − vL−1 k ≤ ch2L k∇2 vk ≤ ch2L kfL k .
(4.2.73)
Dies bedeutet mit der obigen Setzung, daß
−1 L−1
2
L
kA−1
L fL − pL−1 AL−1 rL fL k ≤ chL kfL k .
(4.2.74)
Damit folgt die gewünschte Abschätztung
2
L
−1 L−1
kA−1
L − pL−1 AL−1 rL k ≤ chL .
(4.2.75)
Q.E.D.
Das Resultat für den Zweigitteralgorithmus wird nun verwendet zum Nachweis der Konvergenz des vollen Mehrgitteralgorithmus.
Satz 4.3 (Mehrgitterkonvergenz): Es sei angenommen, daß der Zweigitteralgorithmus konvergiert mit einer L2 -Konvergenzrate ρZG (ν) → 0 für ν → ∞ , gleichmäßig bzgl. L . Dann
konvergiert für hinreichend häufige Glättung der Mehrgitteralgorithmus mit R ≥ 2 (W-Zyklus)
mit einer von L unabhängigen L2 -Konvergenzrate ρM G < 1 ,
(t)
(t)
kuL − M G(L, uL , fL )k ≤ ρM G kuL − uL k.
(4.2.76)
Beweis: Der Beweis wird durch Induktion nach dem Gitterlevel L geführt. Wir betrachten nur
den relevanten Fall R = 2 (W-Zyklus) und werden uns der Einfachheit halber nicht bemühen,
die auftretenden Konstanten zu optimieren. Sei ν so groß, daß die Konvergenzrate des Zweigitteralgorithmus ρZG ≤ 18 ist. Wir wollen zeigen, daß dann die Konvergenzrate des Mehrgitteralgorithmus ρM G ≤ 14 ist, gleichmäßig bzgl. L . Für L = 1 ist dies dann offenbar richtig. Sei nun
auch ρM G ≤ 14 für Gitterlevel L − 1 . Auf Gitterlevel L gilt dann ausgehend von der Iterierten
(2)
(t)
uL mit der approximativen Lösung qL−1 (nach 2-maliger Anwendung der Grobgitterkorrektur)
und der exakten Lösung q̂L−1 der Defektgleichung auf Level L − 1 :
(t+1)
uL
(t)
(t)
(2)
= M G(L, uL , fL ) = ZG(L, uL , fL ) + pL
L−1 (qL−1 − q̂L−1 )
(4.2.77)
178
Nach Induktionsvoraussetzung ist (Man beachte, daß der Startwert der Mehrgitteriteration auf
L−1
Level L − 1 gleich Null ist und ρ̂L−1 = A−1
L−1 rL dL ):
(t)
(2)
L−1
ν
kq̂L−1 − qL−1 k ≤ ρ2M G kq̂L−1 k = ρ2M G kA−1
L−1 rL AL SL (uL − uL )k .
(t)
(4.2.78)
(t)
Kombination der letzten Beziehungen ergibt für den Iterationsfehler eL := uL − uL :
(t)
(t+1)
ν
L−1
(4.2.79)
A
S
k
keL k .
r
keL k ≤ ρZG + ρ2M G kA−1
L
L
L−1 L
Die Norm rechts ist bereits im Zusammenhang mit der Konvergenz des Zweigitteralgorithmus
−1 L−1
ν
L
abgeschätzt worden. Mit dem Zweigitteroperator ZGL = (A−1
L − pL−1 AL−1 rL )AL SL gilt
−1 L−1
−1
L−1
ν
ν
L
ν
ν
A−1
L−1 rL AL SL = SL − (AL − pL−1 AL−1 rL )AL SL = SL − ZGL
und somit
ν
ν
L−1
kA−1
L−1 rL AL SL k ≤ kSL k + kZGL k ≤ 1 + ρZG ≤ 2 .
(4.2.80)
Damit erhalten wir schließlich
(t+1)
keL
(t)
k ≤ ρZG + 2ρ2M G keL k .
(4.2.81)
Mit Hilfe der Annahme über ρZG und der Induktionsannahme folgt
(t+1)
keL
k≤
1
8
was den Induktionsbeweis vervollständigt.
(t)
(t)
1
+ 2 16
keL k ≤ 14 keL k ,
(4.2.82)
Q.E.D.
Für gutartige“ Probleme (symmetrischer, positiv definiter Operator, glatte Koeffizienten,
”
quasi-gleichförmige Gitter u.s.w.) erreicht man in der Regel Mehrgitterkonvergenzraten im Bereich ρM G = 0, 1 − 0, 3 . Die obige Analyse ist nur für den W-Zyklus gültig, da im Beweisteil (ii)
R ≥ 2 benötigt wird. Der V-Zyklus kann nicht auf Basis nur einer Zweigitteranalyse behandelt
werden. In der Literatur finden sich allgemeinere Ansätze, die Konvergenz von Mehrgitterverfahren auch in weniger regulären Situationen garantieren.
Als nächstes diskutieren wir die numerische Komplexität des Mehrgitteralgorithmus. Dabei
werden die folgenden Bezeichnungen verwendet:
OP (T ) = Anzahl der a.Op. zur Durchführung einer Operation T,
R = Anzahl der Defektkorrekturschritte auf den einzelnen Gitterniveaus,
(d = Raumdimension),
Nl = dim Vl ≈ h−d
l
κ = max Nl−1 /Nl ,
1≤l≤L
C0 = OP (A−1
0 )/N0 ,
Cs = max {OP (Sl )/Nl },
Cd = max {OP (dl )/Nl },
Cr = max {OP (rl )/Nl },
Cp = max {OP (pl )/Nl }.
1≤l≤L
1≤l≤L
1≤l≤L
1≤l≤L
In der Praxis ist meist κ ≈ 2−d , Cs ≈ Cd ≈ Cr ≈ Cp ≈ #{anm 6= 0} und C0 N0 ≪ NL .
179
Satz 4.4 (Mehrgitterkomplexität): Unter der Bedingung q := Rκ < 1 gilt für einen Mehrgitterzyklus M GL :
OP (M GL ) ≤ CL NL
mit
CL =
(4.2.83)
(ν + µ)Cs + Cd + Cr + Cp
+ C0 q L ,
1−q
Der Mehrgitteralgorithmus liefert die NL -dimensionale diskrete Lösung uL ∈ VL auf dem Gitter
TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit O(NL ln(NL ))
a.Op. und hat damit (fast) optimale Komplexität.
Beweis: Wir setzen Cl := OP (M Gl )/Nl . Ein Mehrgitterschritt beinhaltet die R-fache Anwendung desselben Algorithmus auf dem nächst gröberen Gitter. Bei Beachtung von Nl−1 ≤ κNl
gilt mit Ĉ := (ν + µ)Cs + Cd + Cr + Cp :
CL NL = OP (M GL ) ≤ ĈNL + R · OP (M GL−1 ) = ĈNL + R · CL−1 NL−1 ≤ ĈNL + qCL−1 NL ,
und folglich CL ≤ Ĉ + qCL−1 . Rekursive Anwendung dieser Beziehung liefert
CL ≤ Ĉ(1 + q + q 2 + ... + q L−1 ) + q L C0 ≤
Ĉ
+ q L C0 .
1−q
Dies impliziert die behauptete Abschätzung (4.2.83). Die Komplexität des Gesamtalgorithmus
ergibt sich dann aus den Beziehungen
−2/d
ρtM G ≈ h2L ≈ NL
,
t≈−
ln(NL )
.
ln(ρM G )
Q.E.D.
Wir bemerken, daß im Beweis der Aussage (4.2.83) die Bedingung
q := Rκ = R max Nl−1 /Nl < 1
1≤l≤L
wesentlich ist. Dies besagt für den W-Zyklus (R = 2), daß sich beim Übergang vom Gitter Tl−1
zum nächst feineren Tl die Anzahl der Gitterpunkte (bzw. Freiheitsgrade) hinreichend stark
erhöhen muß, etwa wie bei einer gleichförmigen Verfeinerung
Nl ≈ 4Nl−1 .
Bei einem adaptiv gesteuerten Verfeinerungsprozeß mit teilweise nur lokaler Gitterverfeinerung
ist dies meist nicht erfüllt; selbst bei Verwendung der Fest-Raten“-Strategie ist z.B. oft nur
”
Nl ≈ 2Nl−1 . In solchen Fällen muß der Mehrgitterprozeß zur Aufwandsersparnis modifiziert
werden. Dies geschieht dadurch, daß die kostenintensive Glättung sowie die anderen Operationen nur jeweils auf den beim Übergang von Tl−1 zu Tl neu hinzugekommenen Gitterpunkten
durchgeführt werden. Bei der Implementierung eines Mehrgitteralgorithmus auf lokal verfeinerten Gittern ist viel Fingerspitzengefühl erforderlich, wenn der resultierende Gesamtalgorithmus
komplexitäts-optimal sein soll.
180
Für das geschachtelte MG-Schema erhält man sogar im strengen Sinne optimale“ Lösungs”
komplexität O(NL ) , da auf jedem Gitterniveau bestmögliche Startwerte verwendet werden.
Satz 4.5 (Geschachteltes Mehrgitterverfahren): Das geschachtelte MG-Schema ist komplexitäts-optimal, d.h.: Es liefert die diskrete Lösung uL ∈ VL auf dem feinsten Gitter TL
im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit einem Aufwand von
O(NL ) a.Op.
Beweis: Die Genauigkeitsanforderung für die Mehrgitteriteration auf Gitterlevel TL ist
(t)
keL k ≤ ĉh2L kf k.
(4.2.84)
(i) Wir wollen zunächst zeigen, daß (4.2.84) beim geschachtelten MG-Schema unter den Voraussetzungen des Mehrgitterkonvergenzsatzes 4.3 auf jedem Level L mit einer (hinreichend
(t)
(t)
großen) festen Zahl t∗ von Mehrgitterschritten erreichbar ist. Sei eL := uL − uL wieder der
(t)
(t)
(0)
Iterationsfehler auf Level L . Nach Annahme ist e0 = 0, t ≥ 1 . Im Fall uL := uL−1 gilt dann
(0)
(t)
(t)
keL k ≤ ρtM G keL k = ρtM G kuL−1 − uL k
(t)
≤ ρtM G kuL−1 − uL−1 k + kuL−1 − uk + ku − uL k
(t)
≤ ρtM G keL−1 k + ch2L kf k .
Rekursive Anwendung dieser Beziehung für L ≥ l ≥ 1 ergibt dann (wegen hl = 2L−l hL )
(t)
(t)
keL k ≤ ρtM G ρtM G keL−2 k + ch2L−1 kf k + ch2L kf k
..
.
(t)
t
2
2t
2
Lt
2
≤ ρLt
M G ke0 k + cρM G hL + cρM G hL−1 + ... + cρM G h1 kf k
2·2
2·L
= c2−2 h2L ρtM G 22 + ρ2t
+ ... + ρLt
kf k
M G2
M G2
≤ c2−2 h2L kf k
22 ρtM G
,
1 − 22 ρtM G
vorausgesetzt 22 ρtM G < 1 . Offenbar gibt es also ein t∗ , so daß (4.2.84) für t ≥ t∗ erfüllt ist,
und zwar gleichmäßig bzgl. L .
(ii) Wir kommen nun zur Aufwandsanalyse. Satz 4.4 besagt, daß ein Zyklus des einfachen“
”
Mehrgitteralgorithmus M G(l, ·, ·) auf dem l-ten Level Wl ≤ c∗ Nl a.Op. benötigt (gleichmäßig
bzgl. l ). Sei nun Ŵl die Anzahl der a.Op. des geschachtelten Schemas auf Gitterlevel l . Dann
gilt konstruktionsgemäß:
ŴL ≤ ŴL−1 + t∗ WL .
Durch Iteration dieser Beziehung erhalten wir mit κ := max1≤l≤L Nl−1 /Nl < 1 :
ŴL ≤ t∗ c∗ {NL + ... + N0 } ≤ ct∗ c∗ NL {1 + ... + κL } ≤
ct∗ c∗
NL ,
1−κ
Q.E.D.
4.3 Übungen
181
4.3 Übungen
Übung 4.1: Das allgemeine “Abstiegsverfahren” zur iterativen Lösung des Gleichungssystems
Ax = b mit symmetrischer, positiv-definiter Matrix A ∈ RN ×N lautet:
Startwert:
für t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Abstiegsrichtung
αt =
d(t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die sog. “Koordinatenrelaxation” erhält man durch zyklische Wahl der Abstiegsrichtungen d(t)
aus den kartesischen Einheitsvektoren {e(1) , . . . , e(N ) } . Man zeige, daß jeder N -Zyklus der Koordinatenrelaxition äquivalent ist zum üblichen Gauß-Seidel-Verfahren. Bemerkung: Für eine
typische FE-Matrix hat die zyklische Koordinatenrelaxation also das Konvergenzverhalten:
|x(tN ) − x| ≤ cq t ,
q ≈ 1 − cond2 (A)−1 ≈ 1 − h2 .
Übung 4.2: Die erste RWA des Laplace-Operators
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem regulären” Gebiet Ω ⊂ R2 werde mit einem FE-Verfahren mit stückweise linea”
ren Ansatzfunktionen auf einer Folge von quasi-gleichförmigen Gittern (d.h. größen- und formregulär) der Weite h diskretisiert. Dies führt auf lineare Gleichungssysteme Ax = b mit symmetrischen, positiv definiten (N × N )-Matrizen A , wobei N die Anzahl der Knotenpunkte
ist.
Welchen arithmetischen Aufwand (ausgedrückt in Potenzen von h) erfordert dabei die Lösung
dieser Gleichungssysteme mit dem CG-Verfahren mit der Genauigkeit des Diskretisierungsfehlers
gemessen in der Energie-Norm” k∇(u − uh )k ? Dazu verwende man die folgende bekannte
”
Fehlerabschätzung für das CG-Verfahren:
√
1 − 1/ κ
t
t
0
√ ,
|x − x |A ≤ 2q |x − x |A ,
q :=
1 + 1/ κ
mit der diskreten Energienorm” kxkA := (Ax, x)1/2 und der Spektralkondition κ := cond2 (A)
”
von A . (Hinweis: Man verwende die bekannte Beziehung für die Spektralkondition von A sowie die aus der obigen Fehlerabschätzung abgeleitete Abschätzung für die Anzahl der Iterationsschritte. Der Aufwand pro CG-Schritt entspricht etwas der zweimaligen Defektberechnung
x → d := Ax − b .)
Übung 4.3: Man versuche, den Beweis der Konvergenz des Zweigitterverfahrens ZG aus der
Vorlesung für den Fall zu verallgemeinern, daß die Restriktion rll−1 : Vl → Vl−1 mit Hilfe lokaler,
bilinearer Interpolation (anstelle der L2 -Projektion) auf dem Gitter Tl−1 definiert ist. Wo ist
dabei das Problem, und wie kann man damit fertig werden?
182
Übung 4.4: Die FE-Diskretisierung des Konvektions-Diffusionsproblems
−∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
führt auf unsymmetrische Systemmatrizen Ah . In diesem Fall erfordert die Analyse des Mehrgitterverfahrens einige Modifikationen. Man übertrage den Beweis aus der Vorlesung für die
Konvergenz des Zweigitteralgorithmus, wenn als Glätter wieder das Richardson-Verfahren
xht+1 = xth − θt (Ah xth − bh ),
t = 0, 1, 2, . . . ,
mit den Dämpfungsparametern θt := 12 kAh k−1 verwendet wird.
Übung 4.5: Zur Lösung der 1. RWA der Laplace-Gleichung
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einer Folge äquidistanter, kartesischer Gitter
Tl mit Gitterweiten hl = 2−l mit Hilfe bilinearer finiter Elemente approximiert. Die diskrete
Gleichung auf Gitterlevel l werde dabei mit einem MG-Verfahren gelöst, wobei das RichardsonVerfahren zur Glättung, die natürliche Einbettung zur Prolongation und die lokale bilineare
Interpolation zur Restriktion verwendet werden. Die Anzahl der Vor- und Nachglättungsschritte
sei ν = 2 und µ = 0 . Wieviele a.Op. kosten dann ungefähr ein V-Zyklus und ein W-Zyklus
ausgedrückt in Vielfachen der Dimension Nl = dim Vl ?
5 Verfahren für parabolische Probleme
Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung parabolischer Anfangs-Randwert-Aufgaben. Der Übersichtlichkeit halber beschränken wir uns dabei
auf das Modellproblem der Wärmeleitungsgleichung in zwei Ortsdimensionen mit Dirichletschen
Randbedingungen, d.h. auf die 1. ARWA:
∂t u + Lu = f
in Ω × (0, T ),
u|∂Ω = 0,
u|t=0 = u0 ,
(5.0.1)
mit einem elliptischen Operator L , der hier exemplarisch als L := −a∆ mit einer Konstanten
a > 0 gewählt wird.
Das Definitionsgebiet Ω ∈ R2 wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g, u0 sind ebenfalls glatt und kompatibel, so daß die
Lösung ebenfalls als glatt angenommen werden kann. Erweiterungen für Probleme mit weniger
regulären Daten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden
gegebenenfalls in Bemerkungen berücksichtigt. Gelegentlich wird auch das eindimensionale Analogon von (5.0.1) betrachtet. Als Basis von Finite-Elemente-Diskretisierungen dient wieder die
variationelle Formulierung von (5.0.1):
(∂t u, ϕ) + a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(5.0.2)
mit dem üblichen Sobolew-Raum V := H01 (Ω) und der symmetrischen und positiv definiten
Energie-Form“ a(u, ϕ) := (a∇u, ∇ϕ)Ω .
”
Bei der Diskretisierung von instationären Problemen gibt es drei verschiedene Vorgehensweisen, die wir im folgenden kurz beschreiben wollen.
i) Linienmethode“: Zunächst wird eine Diskretisierung bzgl. der Ortsvariablen vorgenom”
men, d.h.: mit Hilfe eines Finite-Differenzen- oder Finite-Elemente-Ansatzes werden diskrete“
”
Funktionen uh (t) = uh (·, t) bestimmt aus der Gleichung
u̇h (t) + Ah uh (t) = fh (t), t ≥ 0,
uh (0) = u0h .
(5.0.3)
Im Falle eines Differenzenverfahrens auf einem Ortsgitter {xi }i=1,...,N ist die diskrete Funktion
N → RN die
uh (t) = (un (t))N
n=1 der Vektor der Knotenwerte un (t) ≈ u(xn , t) , Ah = Ah : R
zum verwendeten Differenzenoperator korrespondierende Matrix und fh = bh = (f (xn ))N
n=1 .
Beim Finite-Elemente-Ansatz ist uh (t) ∈ Vh eine Finite-Elemente-Funktion, Ah =: Vh → Vh
das durch
(Ah vh , ϕh ) = a(vh , ϕh ), vh , ϕh ∈ Vh ,
definierte diskrete Analogon zum Differentialoperators L und fh = Ph f ∈ Vh die L2 -Projektion
der rechten Seite f auf Vh . Die Aufgabe (5.0.3) lautet demgemäß in variationeller Form wie
folgt:
(u̇h (t), ϕh ) + a(uh (t), ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh , t ∈ I,
uh (0) = Ph u0 .
(5.0.4)
(n)
Nach Einführung einer Knotenbasis {ϕh , n = 1, ..., N = dim(Vh )} geht dieses Problem über
in ein System für den Vektor Uh (t) = (Un (t))N
n=1 der zugehörigen Knotenwerte,
Mh U̇h (t) + Ah Uh (t) = bh (t), t ≥ 0,
183
Uh (0) = Uh0 ,
(5.0.5)
184
Verfahren für parabolische Probleme
mit der Steifigkeitsmatrix“ und Massenmatrix“
”
”
(n)
(m)
Ah = (a(ϕh , ϕh ))N
n,m=1 ,
(n)
(m)
Mh = ((ϕh , ϕh ))N
n,m=1
der Finite-Elemente-Basis. In beiden Fällen, (5.0.3) oder (5.0.5), handelt es sich um ein System
von (linearen) gewöhnlichen Differentialgleichungen. Dieses wird nun mit einem der üblichen
Schemata bzgl. der Zeit diskretisiert. Nach Wahl einer (zunächst konstanten) Zeitschrittweite k
werden zu den “diskreten“ Zeitleveln tm = mk Approximationen Uhm = (Unm )N
n=1 zu u(·, tm )
bestimmt. Wir sprechen von einem Einschritt-“ bzw. einem Zweischrittverfahren“, wenn Uhm
”
”
aus den vorausgehenden Werten gemäß einer Formel der Form
Uhm = F (Uhm , Uhm−1 ) bzw. Uhm = F (Uhm , Uhm−1 , Uhm−2 )
berechnet wird. Im Falle
Uhm = F (Uhm−1 ) bzw. Uhm = F (Uhm−1 , Uhm−2 )
heißt die Methode explizit“. Zur Durchführung einer nicht expliziten, d.h. impliziten“, Me”
”
thode müssen in jedem Zeitschritt Gleichungssysteme gelöst werden. Die hohe Dimension des
Systems, N = #{Gitterpunkte an } bzw. N = dim(Vh ) , mit N ∼ 103 − 108 impliziert im
Hinblick auf die Lösungsökonomie Einschränkungen bei der Wahl der Verfahren. Es kommen in
der Regel nur Schemata einfacher Struktur, d.h. mit wenigen Matrix-Vektor-Multiplikationen,
und niedriger Ordnung r = 1 − 4 in Frage. Eine weitere wesentliche Einschränkung besteht
in der generischen Steifheit des Systems. Die Systemmatrix Ah hat in Abhängigkeit von der
(gleichförmigen) Gitterfeinheit h die Kondition
κ2 (Ah ) ≈ h−2 .
Bei expliziten Zeitschrittschemata sind also einschneidende Schrittweitenrestriktionen einzuhalten, welche deren Verwendung in der Regel verbietet. Der formale Vorteil der expliziten Verfahren, daß in den einzelnen Zeitschritten keine impliziten Gleichungssysteme zu lösen sind, wird
besonders in höheren Raumdimensionen (d = 2, 3) durch die hohe Zahl von durchzuführenden
Zeitschritten (besonders bei Verwendung lokal verfeinerter Ortsgitter) schnell aufgehoben.
Beispiel numerischer Instabilität: Wir wollen dies anhand einer einfachen Modellsituation illustrieren. Die eindimensionale, homogene Version der ARWA (5.0.1)
∂t u − ∂x2 u = 0 in Ω = (0, 1),
u|∂Ω = 0,
u|t=0 = u0
(5.0.6)
wird auf einem äquidistanten Gitter 0 = x0 < ... < xn < ... < xN +1 = 1 mit Hilfe zentraler
Differenzenquotienten 2. Ordnung,
n
o
∂x2 u(xn , t) ≈ h−2 Un−1 (t) − 2Un (t) + Un+1 (t) .
diskretisiert. Die Vektorfunktion Uh (t) = (Un (t))N
n=1 genügt dann dem System gewöhnlicher
Differentialgleichungen
U̇n (t) − h−2 {Un−1 (t) − 2Un (t) + Un+1 (t)} = 0 ,
wobei bei Berücksichtigung der Randbedingungen U0 ≡ UN +1 ≡ 0 gesetzt ist. Die Anfangswerte
185
sind naturgemäß Un (0) = u0 (xn ). Dies kann kompakt geschrieben werden als
U̇h + Ah Uh (t) = 0 , t ≥ 0,
mit der (N × N )-Matrix

Ah = h−2
−2

 1







0
1
Uh (0) = U 0 ,
0
−2
.. ..
.
.
(5.0.7)





..
.
.


−2 1 

1 −2
Diese Matrix hat, wie wir bereits wissen, die Eigenwerte
0 < λ1 ≤ ... ≤ λN =
4
+ O(h2 ),
h2
(5.0.8)
d.h.: Das nach Ortsdiskretisierung entstandene System (5.0.7) wird für kleines h zunehmend
steif mit Steifigkeitsrate κ = O(h−2 ). Beim expliziten Euler1 -Schema ( Polygonzugmethode“)
”
ist z.B. aus Stabilitätsgründen die Schrittweitenbedingung
−λn k ∈ [−2, 0]
⇒
k ≤ 21 h2
(5.0.9)
einzuhalten. Diese Schrittweitenbeschränkung für explizite Verfahren hat entscheidende praktische Bedeutung. Wir wollen das Phänomen der numerischen Instabilität illustrieren. Dazu
betrachten wir als einfachstes explizites Zeitschrittschema das klassische Euler-Verfahren (Polygonzugmethode) mit äquidistanter Schrittweite k . Dies führt auf die folgenden Differenzengleichungen für die Approximationen Unm ≈ u(xn , tm ) :
Unm+1 = Unm +
Für k = h2 ist dann
k m
m
m
U
−
2U
+
U
n
n+1 .
h2 n−1
(5.0.10)
m
m
Unm+1 = Un−1
− Unm + Un+1
.
Im Fall oszillierender Anfangsdaten u0n = (−1)n ergibt sich
Un1 = (−1)n−1 − (−1)n + (−1)n+1 = −3(−1)n = −3Un0 ,
und bei Fortsetzung dieses Arguments:
Unm = (−3)m Un0 ,
m ≥ 1, n = 1, ..., N.
(5.0.11)
Dieses Verhalten bedeutet numerische Instabilität“. Es mag unrealistisch erscheinen, eine oszil”
lierende Anfangsbedingung der Art Un0 = (−1)n anzunehmen, doch bedingt durch Rundungs-
1
Leonhard Euler (1707-1783), geb. in Basel: universeller Mathematiker und Physiker; bedeutendster und produktivster Mathematiker seiner Zeit; wirkte in Berlin und St. Petersburg; Arbeiten zu allen mathemischen Gebieten seiner Zeit.
186
fehler könnte gelten
Un0 = Vn0 + ε(−1)n
(5.0.12)
mit glatten“ exakten Anfangsdaten V 0 . Wegen der Linearität der betrachteten Differenzen”
gleichungen folgt
Unm = Vnm + ε(−3)m (−1)n ,
(5.0.13)
so daß die anfänglich kleinen Anfangsstörungen schnell anwachsen. Z.B. ist diese für ε = 10−15 >
3−32 bereits nach nur 32 Zeitschritten auf Größe ≈ 1 angewachsen und zwar unabhängig von
der Größe von h .
ii) Rothe-Methode“: Bei der Rothe2 -Methode wird die Differentialgleichung als gewöhnliche
”
Differentialgleichung für eine Hilbertraum-wertige Funktion U (t) ∈ V aufgefaßt und zunächst
mit einem A-stabilen Verfahren in der Zeit diskretisiert. Bei Verwendung z.B. des impliziten
Euler-Schemas ergibt sich eine Folge von speziellen Randwertaufgaben
U m + kLU m = U m−1 + kf m , m ≥ 1,
U 0 (x) = u0 (x) .
Diese Probleme werden nun nacheinander auf möglicherweise wechselnden, dem Lösungsverlauf
angepaßten Ortsgittern diskretisiert. Das Problem ist dabei der adäquate Transfer der jeweiligen
Startlösung U m−1 vom alten auf das neue Ortsgitter. Hier zeigt sich wieder der systematische
Vorteil einer Finite-Elemente-Galerkin-Methode, bei der sich ganz automatisch als richtige Wahl
die L2 -Projektion von U m−1 auf das neue Gitter ergibt.
iii) Globale Orts-Zeit-Diskretisierung: Ähnlich wie bei den Transportproblemen könnte
auch bei der Wärmeleitungsgleichung eine simultane Diskretisierung (etwa mit einem FiniteElemente-Galerkin-Verfahren) auf einem unstrukturierten Gitter der ganzen (x, t)-Ebene erfolgen. Dieser theoretisch durchaus attraktive Ansatz wird aber bei höher dimensionalen Problemen wegen der globalen Kopplung aller Unbekannten sehr rechenaufwendig und spielt daher bei
parabolischen Problemen in der Praxis keine wesentliche Rolle.
Im folgenden Abschnitt werden wir Differenzenapproximationen in Verbindung mit der Linienmethode betrachten. Die Rothe-Methode wird in Verbindung mit Finite-Elemente-Verfahren
im Ort diskutiert. Dies mündet dann auch ohne Probleme in Galerkin-Diskretisierungen simultan in Ort und Zeit, den sog. unstetigen“ oder stetigen“ Galerkin-Verfahren (sog. dG(r)-“
”
”
”
oder cG(r)-Verfahren“).
”
2
Erich Rothe (1895-1988): deutscher Mathematiker; Promotion und Habilitation in Berlin (1928), danach
Assistent in Breslau, nach dem Krieg Prof. an der University of Michigan, USA.
5.1 Differenzenverfahren für parabolische Probleme
187
5.1.1 Zeitschrittverfahren
Wir beginnen mit der Diskussion der Linienmethode“ zur Diskretisierung von parabolischen
”
ARWAn der Art
∂t u + Lu = f
in QT := Ω × I,
u|∂Ω = 0, u|t=0 = u0 ,
(5.1.14)
mit L := −a∆ auf einem beschränkten (regulär berandeten) Gebiet Ω ⊂ R2 und einem Zeitintervall I = [0, T ] . Der Einfachheit halber wird die rechte Seite f gelegentlich zu Null gesetzt.
Ortsdiskretisierung von (5.1.14) mit einem der üblichen Differenzenverfahren (z.B. dem 5Punkte-Operator mit geeigneter Randapproximation) führt auf ein System gewöhnlicher Differentialgleichungen
U̇h (t) + Ah Uh (t) = 0,
t > 0,
Uh (0) = U 0 ,
(5.1.15)
für den Vektor Uh (t) ∈ RN der Knotenwerte. Da die Eigenwerte der Systemmatrix Ah alle reell
sind (oder wenigstens nahe an der rellen Achse liegen), käme zur stabilen Integration des Systems (5.1.15) jede A(0)-stabile Formel in Frage. Dabei muß aber der hohe numerische Aufwand
bei der Durchführung komplizierter impliziter Verfahren hoher Ordnung berücksichtigt werden.
Durch Übertragung der klassischen Zeitschrittformeln für gewöhnliche Differentialgleichungen
auf das System (5.1.15) erhalten wir unter Benutzung der oben eingeführten Bezeichnungen die
folgenden einfachsten Einschrittverfahren:
1) Explizites Euler-Verfahren (Polygonzugmethode):
k−1 {Uhm − Uhm−1 } + Ah Uhm−1 = f m−1 ,
m ≥ 1,
2) Implizites Euler-Verfahren:
k−1 {Uhm − Uhm−1 } + Ah Uhm = f m ,
m ≥ 1,
3) Crank3 -Nicolson4 -Verfahren (Trapezregel):
k−1 {Uhm − Uhm−1 } + 12 Ah (Uhm + Uhm−1 ) = 21 k(f m + f m−1 ),
m ≥ 1,
und die Zweischrittverfahren:
4) BDF(2)-Verfahren (Rückwärtsdifferenzenformel):
m
1 −1
2 k {3Uh
− 4Uhm−1 + Uhm−2 } + Ah Uhm = f m,
m ≥ 2,
5) Mittelpunkts-Verfahren:
m
1 −1
2 k {Uh
3
− Uhm−2 } + Ah Uhm−1 = f m−1 ,
m ≥ 2,
John Crank (1916-): englischer Mathematiker; Prof. an der Brunel University, Uxbridge, England; Beiträge
zur Numerik partieller Differentialgleichungen, bekannt durch das Crank-Nicolson-Verfahren“.
”
4
Phyllis L. Nicolson (1917-1968): englische Physikerin; Lecturer an der Univ. Leeds und an der Univ. Manchester; bekannt durch das Crank-Nicolson-Verfahren“.
”
188
6) Simpson-Verfahren:
m
1 −1
2 k {Uh
− Uhm−2 } + 32 Ah {Uhm + 4Uhm−1 + Uhm−2 } = f m−1 ,
m ≥ 2.
Als Startwerte werden gewöhnlich (im Fall glatter Anfangsdaten) einfach die Restriktionen
Un0 = u0 (an ) verwendet. Bei den Zweischrittverfahren wird der zweite erforderliche Startwert
Uh1 durch Anwendung einer Einschrittformel entsprechender Ordnung gewonnen. Wegen ihrer inhärenten Instabilität (triviales Stabilitätsgebiet) kommen die Mittelpunktsformel und die
Simpson-Formel für die praktische Anwendung nicht in Frage.
Wie bei der Analyse von Differenzenverfahren üblich verwenden wir den Abschneidefehler“
”
m = (τ m )N
τh,k
n n=1 der Differenzenformeln. Diesen erhält man wieder durch formales Auswerten der
Differenzenformeln auf der exakten Lösung:
m
:= um − F (um , um−1 , um−2 ).
k τh,k
Bei einer Ortsdiskretisierung der Ordnung p verhält sich der Abschneidefehler dann gemäß
m
τh,k
= O(hp + kq ),
wobei q die Ordnung“ des Zeitschrittverfahrens ist. Von der Fehleranalyse der Zeitschrittverfah”
ren für gewöhnliche Differentialgleichungen wissen wir bereits, daß die einfachen Euler-Verfahren
die Ordnung q = 1 und das Crank-Nicolson- sowie das BDF(2)-Verfahren die Ordnung q = 2
haben. Später werden wir noch Verfahren der Ordnung q = 3, 4 kennenlernen. Bei der Analyse
dieser Zeitschrittschemata für parabolische Probleme ist die genaue Abhängigkeit des Abschneidefehlers von der örtlichen und zeitlichen Regularität der Lösung interessant.
Hilfssatz 5.1 (Konsistenz): Für die ARWA (5.1.14) genügen die Abschneidefehler der betrachteten Differenzenverfahren den folgenden (scharfen) Abschätzungen:
i) Explizites und implizites Euler-Verfahren:
m
| ≤ max |τhm | + 21 k max |∂t2 u| ;
max |τh,k
Q̄T
Q̄T
Q̄T
(5.1.16)
ii) Crank-Nicolson-Verfahren:
m
| ≤ max |τhm | +
max |τh,k
max |∂t3 u| ;
(5.1.17)
m
| ≤ max |τhm | + 32 k2 max |∂t3 u| .
max |τh,k
(5.1.18)
Q̄T
Q̄T
1 2
12 k
Q̄T
iii) BDF(2)-Verfahren:
Q̄T
Q̄T
Q̄T
Dabei ist τhm = O(h2 ) der Abschneidefehler der Ortsdiskretisierung.
Beweis: Der Abschneidefehler der Ortsdiskretisierung genügt im allgemeinen der Abschätzung
|τhm | = |Lum − Lh um | ≤ ch2 M4m (u),
wobei Lh der Ortsdifferenzenoperator ist und M4 (u) := maxΩ̄ |∇4 um | . Speziell in einer Raum-
189
dimension mit Ω = (0, 1) gilt
|τhm | = |∂x2 um − Lh um | ≤
4 m
1 2
12 h max |∂x u |.
[0,1]
i) Für die explizite Euler-Formel gilt
|k
−1
m
(u − u
m−1
m−1
) + Lh u
Z
−1
| = k
Z
= k−1
Z
≤ k−1 ≤ k−1
Z
tm
tm−1
tm
tm−1
tm
tm−1
tm
tm−1
∂t u dt + Lh um−1 ∂t u dt − ∂t um−1 − Lum−1 + Lh um−1 ∂t u − ∂t um−1 ds + |Lum−1 − Lh um−1 |
(t − tm−1 ) dt
max |∂t2 u| + |τhm−1 |
[tm−1 ,tm ]
Es folgt
m
| ≤ 12 k max |∂t2 u| + max |τhm−1 |.
max |τh,k
Q̄T
Q̄T
Q̄T
Dieselbe Abschätzung gilt auch für die implizite Euler-Formel.
ii) Für die Crank-Nicolson-Formel gilt
|k
−1
m
m−1
(u − u
)+
m
1
2 Lh (u
+u
m−1
Z
−1
)| = k
tm
tm−1
∂t u dt − 12 (∂t um + ∂t um−1 )
+ 12 (Lum − Lh um ) + 21 (Lum−1 − Lh um−1 )
Z tm
−1 1
(t
−
t
)(t
−
t
)
dt
≤k max |∂t3 u|
m
m−1
2
+
tm−1
m−1
m
1
|)
2 (|τh | + |τh
[tm−1 ,tm ]
Wir erhalten damit
m
max |τh,k
|≤
Q̄T
1 2
12 k
max |∂t3 u| + max |τhm |.
Q̄T
Q̄T
iii) Für die BDF(2)-Formel gilt
m
1 −1
2 k {3u
− 4um−1 + um−2 + Lh um } = 12 k−1 {3um − 4um−1 + um−2 − 2k∂t um }
+ Lh um − Lum .
Taylor-Entwicklung um tm liefert
3um − 4um−1 + um−2 − 2k∂t um = 43 k3 ∂t3 u(·, η m )
190
mit gewissen Zwischenstellen η m ∈ [tm−2 , tm ] . Damit erhalten wir
m
| ≤ 32 k2 max |∂t3 u| + max |τhm |.
max |τh,k
Q̄T
Q̄T
Q̄T
Q.E.D.
Die Lösung der ARWA (5.1.14) besitzt die explizite Darstellung
u(x, t) =
∞
X
u0n v (n) (x)e−λn t ,
n=1
(x, t) ∈ QT ,
(5.1.19)
mit den Eigenwerten und (orthonormierten) Eigenfunktionen des regulären elliptischen“ Ope”
rators −a∆ : V ⊂ L2 (Ω) → L2 (Ω) ,
0 < λ1 < ... ≤ λn ≤ ... (n ∈ N),
v (n) (x) ∈ V :
−a∆v (n) = λn v (n) ,
und den Entwicklungskoeffizienten der Startwerte
u0 (x) =
∞
X
u0n v (n) (x) ,
u0n = (u0 , v (n) )Ω .
n=0
Diese Darstellung läßt sich wegen der gleichmäßigen Konvergenz der Reihen wie folgt umformen:
u(x, t) =
=
=
∞
X
∞
X
u0n v (n) (x)
n=1
∞
X
i i
i λn t
(−1)
i!
∞
∞
iX
X
it
(−1)
u0n λin v (n) (x)
=
i!
n=1
i=0
i=0
∞
∞
∞
X
i
i
X
X
it
0 i (n)
i
it
(−1) ∆
un ∆ v (x) =
u0n v (n) (x)
(−1)
i! n=1
i!
n=1
i=0
i=0
∞
X
i1
0
t∆ 0
i
(−1)
i=0
i!
(−t∆) u (x) =: e u (x).
Die Definition der Operatorfunktion et∆ über eine konvergente Taylor-Reihe läßt sich auf beliebige analytische Funktionen übertragen. Wir betonen, daß eine solche kompakte Lösungsdarstellung nur im Fall zeitlich konstanter Koeffizienten a möglich ist. Auf dem diskreten Zeitgitter
gilt dann
u(·, tm ) = ek∆ u(·, tm−1 ),
m ∈ N.
(5.1.20)
Dies legt es nahe, den Zeitschritt tm−1 → tm mit Hilfe einer rationalen Approximation R(z) ≈
ez der Exponentialfunktion der Ordnung“ q + 1 anzusetzen,
”
P (z)
= ez + O(|z|q+1 ), z ≤ 0,
(5.1.21)
R(z) =
Q(z)
mit geeigneten Polynomen P ∈ Pr und Q ∈ Ps , wobei natürlich Q auf z ∈ R− keine Nullstellen
haben darf. Das Diskretisierungsschema lautet dann
Uhm = R(−kAh )Uhm−1
bzw. Q(−kAh )Uhm = P (−kAh )Uhm−1 .
(5.1.22)
191
Die oben betrachteten Einschrittverfahren lassen sich in diesen Rahmen einordnen gemäß:
Expliziter Euler“ :
”
Impliziter Euler“ :
”
Crank-Nicolson“ :
”
R(z) = 1 + z ,
R(z) = (1 − z)−1 ,
R(z) = (1 + 21 z)(1 − 12 z)−1 .
Durch die Ordnungsbedingung
ez Qrs (z) − Prs (z) = O(|z|r+s+1 ),
z ≤ 0,
(5.1.23)
für den Ansatz Prs ∈ Pr , Qrs ∈ Ps wird man auf die sog. Padé5 -Schemata“ geführt. Diese
”
sind eindeutig bestimmt und werden gewöhnlich in der sog. Padé-Tafel“ dargestellt:
”
1
1
1−z+ z 2
2
1+z
1
1
1+ z
2
1
1− z
2
1
1+ z
3
2
1
1− z+ z 2
3
6
1
1+z+ z 2
2
1
2
1
1+ z+ z 2
3
6
1
1− z
3
1
1
1+ z+ z 2
2
12
1
1
1− z+ z 2
2
12
...
...
...
...
1
1
1
1−z
1
1
1+x+ z 2 + z 3
2
6
1
3
1
1
1+ z+ z 2 + z 3
4
4
24
1
1− z
4
...
...
...
...
...
1
1 3
1
z
1+ z+ z 2 +
2
10
120
1
1 2
1 3
1− z+ z −
z
2
10
120
...
...
...
...
.
Offensichtlich sind alle bisher betrachteten Einschrittschemata Padé-Formeln und damit in
diesem Sinne ordnungsoptimal. Aus der Padé-Tafel erhalten wir nun weitere Zeitschrittverfahren
höherer Ordnung. Dabei kommen aus Ökonomiegründen nur die diagonalen“ oder subdiago”
”
nalen“ Padé-Schemata in Frage; z.B. die folgenden impliziten Verfahren 3. bzw. 4. Ordnung:
(I +
(I + 13 kAh )Uhm = (I − 32 kAh + 61 k2 A2h )Uhm−1
1
2 kAh
+
m
1 2 2
12 k Ah )Uh
= (I −
1
2 kAh
+
m−1
1 2 2
12 k Ah )Uh
(q = 3),
(q = 4).
Wir bemerken für die weitere Analyse, daß eine rationale Approximation R(z) der Exponentialfunktion (der Ordnung r ≥ 1 ) die folgende Eigenschaft hat:
|R(z)| ≤ eδz ,
−1 ≤ z ≤ 0,
(5.1.24)
mit einem geeigneten δ > 0 . Die Wirkung der Zeitschrittschemata des Typs (5.1.22) läßt sich
mit Hilfe der Spektralzerlegung der Matrix Ah wieder beschreiben durch:
Uhm
=
N
X
n=1
5
Uj0 R(−kλn )m v (n) ,
m ≥ 1,
Henri Eugène Padé (1785-1836): französischer Mathematiker; Prof. in Poitiers und Bordeaux; entwickelte die
sog. Padé-Approximation.
192
bzw. (mit der Euklidischen Vektornorm | · | )
|Uhm |2 =
N
X
n=1
|Un0 |2 |R(−kλn )|2m .
Ihr qualitatives Verhalten läßt sich also weitgehend durch die Eigenschaften der verwendeten
rationalen Funktion R(z) charakterisieren. Wir stellen einige wichtige Bedingungen für die
folgende Analyse zusammen.
(i) Die A-Stabilität
|R(z)| ≤ 1 ,
z ≤ 0.
sichert die Stabilität“ der Zeititeration supm≥0 |Uhm | < ∞ .
”
(ii) Die strenge A-Stabilität
|R(z)| ≤ 1 − ck , z ≤ −1,
sichert die Beschränktheit der diskreten Lösung auch im Fall inhomogener rechter Seiten,
supm≥0 |Uhm | < c supm≥0 |f m | .
(iii) Die starke A-Stabilität
|R(z)| ≤ κ < 1 ,
z ≤ −1 ,
sichert die (exponentielle) Dämpfung hochfrequenter“ Lösungsanteile und macht das Verfahren
”
robust gegenüber lokalen Störungen der Daten ( Glättungseigenschaft“).
”
(iv) Zur korrekten Wiedergabe von Schwingungsprozessen (im Ort oszillierenden Lösungen)
sollte
R(±i) ∼ 1
sein, um diese Schwingungen möglichst wenig zu dämpfen ( numerischen Dissipativität“).
”
Offensichtlich können nur implizite Verfahren die gelisteten Eigenschaften haben. Das implizite Euler-Schema (und genauso alle sub-diagonalen Padé-Schemata)
ist stark A-stabil (mit
√
Limes κ = 0 ), neigt aber zur Überdämpfung: |(1 + i)−1 | = 1/ 2 . Dagegen ist das CrankNicolson-Schema (und genauso alle diagonalen Padé-Schemata) nur einfach A-stabil,
1 − 21 z
= 1,
lim
z→−∞ 1 + 1 z
2
besitzt aber praktisch auch keine numerische Dissipation: |(1 − i/2)(1 + i/2)−1 | = 1 . Die fehlende starke A-Stabilität hat nachteilige Konsequenzen im Fall von irregulären Anfangswerten
u0 (z.B.: lokalen Temperaturspitzen). Die durch diese Anfangsdaten induzierten hochfrequenten
Fehleranteile werden durch das Crank-Nicolson-Schema nur unzureichend ausgedämpft, so daß
sich ein unphysikalisches Lösungsverhalten zeigen kann. Es sei daran erinnert, daß der kontinuierliche Differentialoperator stark dämpfend ist:
ku(t)k ≤ e−λmin t ku0 k ,
t ≥ 0,
mit dem kleinsten Eigenwert des Ortsoperators, λmin > 0 .
Bei Verwendung des Crank-Nicolson-Schemas für Rechnungen über lange Zeiträume sollte
es stabilisiert werden, um wenigstens strenge A-Stabilität zu sichern. Dies kann ohne Reduktion
193
der Konsistenzordnung durch einen leichten k-abhängigen Schift erfolgen:
I + 21 (1 + ck)kAh Uhm = I − 21 (1 − ck)kAh Uhm−1 .
(5.1.25)
Verfahren höherer Ordnung erfordern die Invertierung der Operatorfunktion Q(−kAh ) . Dies
ist in der Regel zu teuer. Einerseits ist die Besetzungstruktur von Q(−kAh ) selbst bei Polynomgrad j = 2 bereits deutlich dichter als die von Ah , andererseits würde das Arbeiten mit der
Linearfaktorzerlegung Q(z) = (z − µ)(z − µ̄) die Verwendung (kostspieliger) komplexer Arithmetik erfordern. Geeignet wärenQdagegen Schemata, bei denen das Nennerpolynom in reelle
Linearfaktoren zerfällt: Q(z) = sj=1 (z − µj ), µj ∈ R . Durch diesen Ansatz sollten sich systematisch Verfahren mit günstigeren Eigenschaften als die der einfachen Basisschemata gewinnen
lassen.
Ein Beispiel für einen solchen Ansatz ist die parameter-abhängige rationale Funktion
(1 + αθ ′ z)(1 + βθz)2
= ez + O(|z|3 ),
(1 − αθz)2 (1 − βθ ′ z)
Rθ (z) =
z ≤ 0,
√
mit θ = 1 − 12 2 = 0, 292893..., θ ′ = 1 − 2θ und beliebigen Werten α ∈ ( 12 , 1], β = 1 − α . Das
auf dieser rationalen Funktion basierende Schema ist wegen
|Rθ (z)| < 1 , z < 0 ,
β
< 1.
α
lim |Rθ (z)| =
z→−∞
stark A-stabil. Die Entwicklung
Rθ (z) = 1 + z + 12 z 2 {1 − (α − β)(2θ 2 − 4θ + 1)} + 16 r(θ, α)z 3 + O(|z|4 )
zeigt, daß für die obige Parameterwahl von der Ordnung O(k2 ) ist. Für die Güte dieser Approximation im Vergleich zu der des Crank-Nicolson-Schemas ist die Größe der führenden Fehlerkonstante r(α) bestimmend. Eine Taylor-Entwicklung ergibt
2
3
r(θ, α) = (18θ ′ + 24θ 3 )α3 + (42θ 2 θ ′ + 12θθ ′ + 30θ ′ )α2 β
2
3
2
3
+ (12θ 3 + 30θ 2 θ ′ + 24θθ ′ + 6θ ′ )αβ 2 + (6θ 2 θ ′ + 12θθ ′ + 6θ ′ ).
Im betrachteten Bereich {0, 5 < α ≤ 1} ist |r(θ, α)| ≤ 0, 5 . Damit ist die Fehlerkonstante dieser
1
der
Approximation nur in akzeptablem Maß größer als die entsprechende Fehlerkonstante 12
Trapezregel. Das zugehörige Verfahren läßt sich in Form eines Teilschrittschemas schreiben (hier
für den inhomogenen Fall),
Teilschritt-θ-Verfahren (Fractional-Step-θ-Method):
(I + αθkAh )U m−1+θ = (I − βθkAh )U m−1 + θkfhm−1 ,
′
(I + βθ kAh )U
m−θ
′
= (I − αθ kAh )U
m−1+θ
(I + αθkAh )U m = (I − βθkAh )U m−θ +
′
+ θ kfhm−θ ,
θkfhm−θ .
(5.1.26)
(5.1.27)
(5.1.28)
Jeder der Teilschritte hat die Form eines geschifteten Crank-Nicolson-Schritts, so daß der Gesamtaufwand pro Zeitschritt dem von drei Crank-Nicolson-Schritten entspricht. Für den speziellen Wert
α = (1 − 2θ)(1 − θ)−1 = 0, 585786...
194
ist αθ = βθ ′ , so daß die zu invertierenden Matrizen in den drei Teilschritten übereinstimmen,
was z.B. bei der direkten Lösung der Gleichungssysteme ausgenutzt werden kann. Eine genaue
Analyse des Abschneidefehlers des FS-Schemas zeigt, daß seine führende Fehlerkonstante nur
wenig größer als die von drei kombinierten Crank-Nicolson-Schritten ist:
τkm = ĉk2 + O(k3 ),
ĉF S ∼ ĉ3×CN .
Dies bedeutet, daß das FS-Schema gegenüber dem CN-Schema bzgl. Genauigkeit und Aufwand
gleichwertig ist, aber über eine höhere Robustheit verfügt. Das FS-Schema hat sich in der Praxis als besonders geeignet zur Behandlung von parabolischen Problemen mit nicht notwendig
regulären Daten und geringer natürlicher Eigendissipation erwiesen.
5.1.2 Stabilität und Konvergenz
Wir wollen nun die Stabilität und Konvergenz von Diskretisierungen der Wärmeleitungsgleichung untersuchen. Dabei bedienen wir uns exemplarisch verschiedener Techniken, die alle diskrete Analoga von Analysemethoden beim kontinuierlichen Problem sind.
i) Maximumprinzipmethode“
”
Eine einfache, direkte Variante der Maximumprinzipmethode kann bei gewissen expliziten Differenzenschemata angewendet werden. Die Ortsdiskretisierung führe auf eine M-Matrix Ah . Für
die explizite Euler-Formel
Uhm = Uhm−1 − kAh Uhm−1
gilt dann wegen der Diagonaldominanz von Ah :
|Unm | = |1 − kann ||Unm−1 | + k
kann ||Unm−1 | +
≤ |1 −
X
ν6=n
|anν ||Uνm−1 |
kann max |Uνm−1 |.
ν
Unter der Schrittweitenbedingung
2
k ≤ max{a−1
nn } ∼ ch
(5.1.29)
n
folgt daher die L∞ -Stabilität des Verfahrens
max |Unm | ≤ max |Unm−1 | ≤ ... ≤ max |Un0 |,
n
n
n
m ≥ 1.
(5.1.30)
Im Fall des 5-Punkte-Schemas ist ann = 4h−2 , so daß die Stabilitätsbedingung (5.1.29) die
Form
k ≤ 41 h2
(5.1.31)
erhält.
Satz 5.1 (Explizites Euler-Verfahren): Unter der Schrittweitenbedingung (5.1.29) gilt für
195
das explizite Euler-Verfahren die Konvergenzabschätzung
m
2
m
1
max |Uh − u(·, tm )| ≤ T 2 k max |∂t u| + max |τh | .
QT
Q̄T
Q̄T
(5.1.32)
mit dem örtlichen Abschneidefehler τhm = O(hq ) .
Beweis: Der Fehler em := u(·, tm ) − U m genügt der Gleichung
m
k−1 (em − em−1 ) + Ah em = τh,k
mit dem Abschneidefehler
m
| ≤ 12 k max |∂t2 u| + max |τhm | .
max |τh,k
Q̄T
Q̄T
Q̄T
Das bei der Herleitung der Stabilitätsbedingung (5.1.29) verwendete Argument liefert
m
|
max |em | ≤ max |em−1 | + k max |τh,k
Ω̄
Ω̄
Q̄T
Durch Iteration dieser Abschätzung folgt weiter wegen e0 = 0 :
max |em | ≤ k
Ω̄
≤
m
X
µ
|τh,k
|
µ=1
2
m
1
2 tm k max |∂t u| + tm max |τh |.
Q̄T
Q̄T
Dies impliziert die behauptete Fehlerabschätzung.
Q.E.D.
Eine wichtige Eigenschaft des kontinuierlichen Wärmeleitungsoperators ist seine inverse
”
Monotonie“, d.h.: Lösungen zu nicht-negativen Anfangsdaten und rechter Seite bleiben nichtnegativ. Diese Eigenschaft überträgt sich auf die diskretisierten Probleme, wenn die Systemmatrix Ah M-Matrix ist.
(i) Für das explizite Euler-Verfahren folgt unter der Schrittweitenbedingung (5.1.29) aus Unm−1 ≥
0 und fnm ≥ 0 notwendig auch
X
Unm = (1 − kann )Unm−1 + k
|anν |Uνm−1 + kfnm ≥ 0.
ν6=n
(ii) Für das implizite Euler-Verfahren ist im Falle Unm−1 ≥ 0 und fnm ≥ 0
(Ih + kAh )Uhm = Uhm−1 + kfhm ≥ 0.
Da mit Ah natürlich auch Ih + kAh M-Matrix ist, gilt (Ih + kAh )−1 ≥ 0 . Es folgt Uhm ≥ 0 .
In beiden Fällen ist also auch das diskrete Schema invers-monoton“. Dies ist i.a. für das Crank”
Nicolson-Schema nicht der Fall.
ii) Von Neumannsche Methode“ (Fourier-Methode)
”
Wir beschränken uns auf den örtlich eindimensionalen Fall mit Ω = (−π, π) ,
∂t u − ∂x2 u = 0 in QT ,
196
mit periodischen“ Dirichlet-Randbedingungen
”
u(−π, t) = u(π, t),
t ≥ 0.
In diesem Fall kann die Lösung der ARWA nach trigonometrischen Funktionen entwickelt werden
(Fourier-Entwicklung). In komplexer Schreibweise lautet dies
u(x, t) =
∞
X
2
a0ν eiνx eν t ,
(5.1.33)
ν=0
mit den Entwicklungskoeffizienten a0ν der Anfangsbedingung. Auf einem äquidistanten Punktgitter {xn = −π + nh, n = 0, ..., N = 2π/h} machen wir für die diskrete Lösung Uhm =
{Unm , n = 0, ..., N }, m ≥ 0, den analogen Entwicklungsansatz
Unm
=
N
X
iνnh
am
ν e
=:
N
X
a0ν ωνm eiβν n
(5.1.34)
ν=0
ν=0
mit βν := νh und zu bestimmenden Parametern ων ∈ C . Wir fragen nach der Stabilität für
m → ∞ der Differenzendiskretisierung bzgl. der diskreten Spektralnorm
kUhm kh :=
N
X
n=1
2
|am
n|
1/2
.
Die Wirkung des (linearen) Differenzenschemas kann für jede einzelne Fourier-Komponente separat untersucht werden. Gesucht sind Bedingungen an k und h , unter denen |ων | ≤ 1 ist für
alle möglichen βν . Dann liegt Stabilität vor in dem Sinne, daß
kUhm k2h =
N
X
n=1
|a0n |2 |ων |2m ≤
N
X
n=1
|a0n |2 = kUh0 k2h .
(5.1.35)
Wir führen diese Analyse wieder exemplarisch für das explizite Euler-Schema durch. Mit r :=
kh−2 gilt
m
m
Unm+1 = rUn−1
+ (1 − 2r)Unm + rUn+1
.
Einsetzen von Unm := ω m eiβn ergibt
ω m+1 eiβn = rω m eiβ(n−1) + (1 − 2r)ω m eiβn + rω m eiβ(n+1) ,
und nach Vereinfachung
ω = re−iβ + (1 − 2r) + reiβ .
Es liegt Stabilität vor, wenn |ω| ≤ 1 für beliebiges β . Unter Ausnutzung der Beziehungen
eiβ = cos(β) + i sin(β),
cos(β) = 1 − 2 sin2 ( 12 β),
folgt
ω = r eiβ + e−iβ + (1 − 2r) = r (cos(β) + i sin(β) + cos(β) − i sin(β)) + (1 − 2r)
= r 2 − 4 sin2 ( 12 β) + (1 − 2r) = 1 − 4r sin2 ( 12 β).
197
Stabilität liegt vor für
−1 ≤ 1 − 4r sin2 ( 21 β) ≤ 1 ∀β,
was äquivalent ist zu
r sin2 ( 12 β) ≤ 12 .
Dies führt auf die schon bekannte Stabilitätsbedingung
k ≤ 21 h2 .
(5.1.36)
Die Fourier-Methode kann auch für exotischere“ Differenzenformeln angewendet werden.
”
Wir demonstrieren dies anhand des klassischen Du Fort6 -Frankel7 -Verfahren“:
”
1
1
m
m
Unm+1 − Unm−1 − 2 Un−1
= 0.
(5.1.37)
− (Unm+1 + Unm−1 ) + Un+1
2k
h
Sein Abschneidefehler verhält sich wie
max |τnm | = O(k2 /h + k2 + h2 ).
n,m
(5.1.38)
Die von Neumannsche Stabilitätsanalyse liefert für die Verstärkungsfaktoren die Darstellung
( r := k/h2 )
p
2r cos(β) ± 1 − 4r 2 sin2 (β)
.
(5.1.39)
ω=
1 + 2r
Dies impliziert , daß |ω| ≤ 1 für alle β , d.h.: Das DuFord-Frankel-Schema ist unbedingt stabil.
Analog zeigt man, daß das sog. Richardson-Verfahren“
”
1
1
m
m
(Unm+1 − Unm−1 ) − 2 (Un−1
− 2Unm + Un−1
)=0
(5.1.40)
2k
h
unbedingt instabil ist. Obwohl es die optimale“ Konsistenzordnung O(h2 + k2 ) besitzt, ist
”
es also praktisch unbrauchbar. Dies ist nicht verwunderlich, da dieses Schema ein Derivat der
Mittelpunktsregel mit dem Stabilitätspolynom π(z, hλ) und den Wurzeln z1,2 = hλ ± (h2 λ2 +
1)1/2 ist.
Die von Neumann’sche Fourier-Methode zur Stabilitätsanalyse von Differenzenschemata ist
auf den Fall periodischer Dirichlet-Randbedingungen bzw. den Grenzfall von Ganzraum-Proble”
men“ ( Ω = R1 ) beschränkt und erfordert äquidistante Ortsgitter. Für allgemeinere Ortsdiskretisierungen anwendbar ist die im folgenden präsentierte Spektralmethode“.
”
iii) Spektral-Methode:
Die symmetrische, positiv definite Matrix Ah habe die Eigenwerte und zugehörigen (l2 -orthonormierten) Eigenvektoren
0 < λ1 ≤ ... ≤ λN ,
6
{w(n) , n = 1, ..., N }.
E.C. Du Fort (????-????): ????; Publ. mit S.P. Frankel: Stability conditions in the numerical tratment of
parabolic differential equations, Math. Tables and other Aids to Comput. (jetzt Math. Comput.) 7, 135-152
(1953).
7
S.P. Frankel (????-????): ????
198
Jede Gitterfunktion besitzt dann eine Entwicklung der Form
Uhm =
N
X
an w(n) ,
n=1
an = hUhm , w(n) i.
Dabei ist das Skalarprodukt h·, ·i für eine FD-Diskretisierung im Ort wieder ein diskretes Analogon der kontinuierlichen L2 -Norm,
hv, wi :=
N
X
h2n vn wn ,
n=1
und für eine FE-Diskretisierung gerade diese: hv, wi := (v, w)Ω . Entsprechend sind die zugehörigen Normen kuk := hv, vi1/2 definiert. Wir analysieren im folgenden isoliert den Zeitschrittfehler
im Rahmen der Linienmethode.
Satz 5.2 (Glättungseigenschaft): Jedes stark A-stabile Einschrittschema vom Typ (5.1.22)
der Ordnung r besitzt die Glättungseigenschaft:
kUhm − um
hk≤c
kr 0
ku k,
trm h
m > 0.
(5.1.41)
Beweis: Nach Voraussetzung ist supz≥0 |R(−z)| ≤ 1 , limz→∞ |R(−z)| ≤ ω < 1 und
|R(−z) − e−z | ≤ c|z|r+1 ,
0 ≤ z ≤ 1.
O.B.d.A. nehmen wir an, daß |R(−z)| ≤ ω < 1 für z ≥ 1 . Wir verwenden wieder das Spektralargument von oben. Mit den Eigenwerten 0 < λ1 ≤ ... ≤ λN von Ah und einem zugehörigen
Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren gilt wieder für den Anfangswert
u0h =
N
X
αn w(n)
n=1
die Abschätzung ( τn := kλn )
|Uhm
−
2
um
h|
=
N
X
n=1
=
2
α2n R(−kλn )m − e−mkλn X
τn ≤1
... +
X
... .
τn >1
Für die erste Summe rechts gilt mit einem geeigneten δ > 0 :
X
τn ≤1
... =
2
2 m−1
X X
R(−τn )m−1−µ e−µτn α2n
R(−τn ) − e−τn τn ≤1
≤c
X
τn ≤1
µ=0
τn2r+2 m2 e−2δ(m−1)τn α2n
≤ cm−2r |u0h |2 .
199
Für die zweite Summe rechts gilt entsprechend mit einem δ > 0 :
o
n
X
X
... ≤ 2
α2n |R(−τn )|2m + e−2mτn
τn >1
τn >1
≤ ce−δm
X
τn >1
α2n ≤ cm−2r |u0h |2 .
Kombination dieser beiden Abschätzungen liefert wegen m = tm /k :
2
|Uhm − um
h| ≤c
k2r 0 2
|uh | .
t2r
m
(5.1.42)
Q.E.D.
Das populäre Crank-Nicolson-Schema
Uhm = (Ih + 21 kAh )−1 (Ih − 21 kAh )Uhm−1
besitzt als nicht stark A-stabiles Schema nicht die volle Glättungseigenschaft. Wir wollen diesen
Defekt anhand einer Modellbetrachtung erläutern. Sei
Uh0
=
N
X
α0n v (n)
⇒
n=1
Uhm
=
N
X
α0n
n=1
1 − kλ /2 m
n
v (n) .
1 + kλn /2
Die Lösungskomponente zur höchsten Frequenz Λ = λN verhält sich wie
ωm =
1 − kΛ/2 m
1 + kΛ/2
∼ e−tm Λ ,
was dem Abfall der exakten“ Lösung entspricht.
”
(i) Für kΛ < 2 (⇔ k ∼ h2 ) ist
|ω| ≤ e−δ , δ > 0,
was den korrekten exponentiellen Abfall e−δm impliziert.
(ii) Im Fall kΛ ∼ k/h2 ∼ 4/h (⇔ k ∼ h) ist
ω∼−
1 − h/2
,
1 + h/2
was oszillierendes Verhalten (−1)m e−hm impliziert.
Zur Dämpfung dieser Oszillationen in den hochfrequenten“ Komponenten können folgende
”
Strategien verwendet werden:
a) Mittelbildung:
Ũh1
=
0
1
4 {Uh
+
2Uh1
+
Uh2 }
=
N
X
n=1
α0n
n1
4
+
1 1 − 21 kλn 1 1 − 12 kλn 2 o (i)
w .
+
2 1 + 21 kλn 4 1 + 12 kλn
200
Auswertung des Ausdrucks in der Klammer ergibt
1 + kλn + 12 k2 λ2n + 2 − 21 k2 λ2n + 1 − kλn + 41 k2 λ2n
1
=
1
1
2
4(1 + 2 kλn )
(1 + 2 kλn )2
und somit
Ũh1
=
N
X
αn
.
(1 + 21 kλn )2
n=1
b) Euler-Dämpfung: Der Zeitschrittprozeß wird mit zwei impliziten Euler-Schritten mit halber
Schrittlänge gestartet. Dies ergibt
Ũh1 =
N
X
n=1
α0n
1
1 + 12 kλn
2
w(n) .
Satz 5.3 (Gedämpftes Crank-Nicolson-Verfahren): Das durch zwei Euler-Schritte gedämpfte Crank-Nicolson-Verfahren besitzt die Glättungseigenschaft:
kUhm − um
hk≤c
Beweis: Für z ≥ 0 gilt
1 z3
−z 1 − 2 z ,
≤c
e −
1
1 + 2z
1 + 12 z
k2 0
ku k.
t2m h
−z
e −
Wir verwenden dies in der folgenden Abschätzung:
2
kUhm − um
hk =
N
X
n=1
α2n
(5.1.43)
1 z2
≤c
.
1+z
1+z
o2
2
n 1 − 1 kλ m
1
n
−mkλn
2
−
2
e
1 + 21 kλn
1 + 12 kλn
Wir bezeichnen den Inhalt der äußeren Klammer mit σnm und setzen τn := kλn . Es gilt
n
σnm = e−(m−2)τn e−2τn −
1 − 1 τ m
2 o n
2
o
1
1
−(m−2)τn
2 n
−
+
e
−
2
1 + 12 τn
1 + 12 τn
1 + 21 τn
1
1
e−τn +
= e−(m−2)τn e−τn −
1 + 21 τn
1 + 12 τn
1
2 m−3
M −3−µ
X
1 − 12 τn 1
−µτn 1 − 2 τn
e
.
+ e−τn −
1 + 12 τn 1 + 21 τn µ=0
1 + 12 τn
i) Fall τn ≤ 2 :
1
1 − 21 τn
− 2 τn
.
≤
e
1 + 21 τn
Dies sieht man wie folgt: Wegen ez ≥ z gilt −1 + ze−z ≤ 0 . Die Funktion f (z) := 1 − z −
(1 + z)e−z hat die Eigenschaften f (0) = 0 und f ′ (z) = −1 + ze−z ≤ 0 und folglich f (z) ≤ 0 .
201
Damit erschließen wir
|σnm |
m−3
o
n
X
3 −mτn /2
−mτn 2
e−µτn /2
τn + τi e
≤c e
µ=0
n
1 − e−(m−2)τn /2 o
≤ c e−mτn τn2 + τn3 e−mτn /2
1 − e−τn /2
2
c
k
≤ 2 =c 2 .
m
tm
ii) Fall τn > 2 :
1 − τ /2 n
≤ e−2/τn .
1 + τn /2
Damit erschließen wir:
n
1o
|σnm | ≤ c e−mτn + e−2(m−2)/τn 2
τn
m 2 1 o
n
1
≤ c (mτn )2 e−mτn 2 + e−2m/τn
m
τ n m2
1
k2
≤c 2 =c 2 .
m
tm
Zusammenfassung der Resultate (i) und (ii) liefert nun:
2
kUhm − um
hk ≤c
N
k4 X 2
αn .
t4m
(5.1.44)
n=1
Q.E.D.
Auch die Spektralmethode ist auf den Fall parabolischer Probleme mit zeitunabhängigen,
selbstadjungierten Operatoren wie dem Laplace-Operator ∆ beschränkt. Die weitreichendste
Analysetechnik ist die sog. Energie-Methode“ (Hilbertraum-Methode), welche auch für Pro”
bleme mit unsymmetrischen Operatoren mit zeitabhängigen Koeffizienten anwendbar ist. Wir
demonstrieren diese Technik hier aber nur für die vorliegende Modellsituation.
iv) Energie-Methode:
Wir betrachten das populäre Crank-Nicolson-Schema. Für Funktionen (vn )N
n=1 auf einem äquidistanten Quadratgitter sind
(v, w)h := hd
N
X
n=1
vn wn ,
1/2
kvkh := (v, v)h ,
diskrete Analoga des L2 -Skalarprodukts und der zugehörigen L2 -Norm.
202
Satz 5.4 (Crank-Nicolson-Verfahren): Das Crank-Nicolson-Verfahren hat für hinreichend
glatte Lösung u den globalen Diskretisierungsfehler
max ku − Uh kh ≤ c(u) T {h2 + k2 } ,
Q̄T
(5.1.45)
mit einer Konstante c(u) ≈ maxQ̄T {|∂t3 u| + a|∇4 u|} .
Beweis: Für den Fehler em := um − U m gilt
m
k−1 (em − em−1 ) + 12 Ah (em + em−1 ) = τh,k
.
Multiplikation dieser Identität mit em + em−1 und Summation über m ergibt
m
, em + em−1 )h .
k−1 {kem k2h − kem−1 k2h } + 12 (Ah (em + em−1 ), em + em−1 )h = (τh,k
Der kleinste Eigenwert von Ah ist λ > 0 . Damit erschließen wir
m 2
kh ,
k−1 {kem k2h − kem−1 k2h } + 21 λkem + em−1 k2h ≤ 12 λkem + em−1 k2h + 12 λ−1 kτh,k
bzw.
m 2
kem k2h ≤ kem−1 k2h + 21 λ−1 kkτh,k
kh .
Wir summieren nun über µ = m, ..., 1 und erhalten
kem k2h ≤ ke0 k2h + 12 λ−1 k
m
X
µ=1
µ 2
kτh,k
kh .
Mit e0 = 0 und der obigen Abschätzung für den Abschneidefehler folgt schließlich die Behauptung.
Q.E.D.
5.2 FE-Galerkin-Verfahren für parabolische Probleme
203
Wir diskutieren nun die Rothe-Methode zur Lösung des Problems
∂t u − ∆u = f
in QT = Ω × [0, T ],
(5.2.46)
mit den Nebenbedingungen u|t=0 = u0 und u|∂Ω = 0 . Da die folgende Analyse exemplarischen
Charakter hat, betrachten wir nur das implizite Euler-Schema. Dieses lautet angewendet auf das
kontinuierliche Problem (5.2.46)
−1
(U m − U m−1 ) − ∆U m = f¯m ,
km
U 0 := u0 ,
(5.2.47)
wobei die rechte Seite im zeitlichen Mittel ausgewertet wird gemäß
Z tm
m
−1
¯
f (t) dt = f m + O(km ).
f := km
tm−1
Die Zeitschrittweite km := tm − tm−1 darf hier variieren, um eine möglichst gute Anpassung an
die Lösungseigenschaften zu erreichen. Mechanismen zur adaptiven Wahl der Zeitschrittweiten
auf der Basis von a posteriori Fehlerabschätzungen werden weiter unten diskutiert.
Die einzelnen Zeitschritte seien mit Hilfe eines FE-Verfahrens mit Ansatzräumen Vhm ⊂ V
auf möglicherweise von Zeit zu Zeit wechselnden Gittern Tm
h diskretisiert:
(Uhm , ϕ) + km (∇Uhm , ∇ϕ) = (Uhm−1 , ϕ) + km (f¯m , ϕ)
∀ϕ ∈ Vhm .
(5.2.48)
Die Varianz der Ortsdiskretisierungen im Verlaufe der Zeititeration ermöglicht die dynamische
adaptive Anpassung der Ortsgitter an die momentane Lösungsstruktur. In Operatorschreibweise
lautet das Schema (5.2.47)
m m−1
m
+ km Phm f¯m ,
(Ihm + km Am
h )Uh = Ph Uh
Uh0 = Ph0 u0 ,
(5.2.49)
mit der L2 -Projektion Phm auf Vhm . Bezüglich der üblichen Knotenbasen {ϕm,n
h , n = 1, ..., Nm =
m
m
dim Vh } der Räume Vh läßt sich dies als lineares Gleichungssystem zur Bestimmung der zuNm schreiben. Dazu führen wir zusätzlich zu Massemagehörigen Knotenwertevektoren xm
h ∈R
trizen, Steifigkeitsmatrizen und Lastvektoren
Nm
m,j
,
ϕ
)
Mhm := (ϕm,i
,
h
h
i,j=1
Nm
m,i
m,j
Am
,
h := (∇ϕh , ∇ϕh )
i,j=1
Nm
¯m m,j
bm
h := (f , ϕh )
j=1
m−1
und Vhm ein:
auf dem Gitter Tm
h noch Transfermatrizen zwischen den Räumen Vh
Nm−1 ,Nm
m,n
Mhm−1,m := (ϕm−1,j
,
ϕ
)
.
h
h
j,n=1
Damit schreibt sich
Nm−1
(Uhm−1 , ϕm,n
h )=
X
j=1
m−1,m m−1
xm−1
(ϕm−1,j
, ϕm,n
xh
j
h
h ) = Mh
204
und folglich
m−1,m m−1
m
xh + km Mhm bm
(Mhm + km Am
h.
h )xh = Mh
(5.2.50)
Wir wollen dieses Verfahren im folgenden im Hinblick auf Stabilität, Konvergenz sowie a priori
und a posteriori Fehlerabschätzung untersuchen.
5.2.1 A priori Konvergenzabschätzungen
Der natürliche Ansatz zur Analyse von FE-Diskretisierungen ist die Energie-Methode“. Wir
”
geben zunächst einen einfachen Beweis für das implizite Euler-Verfahren unter realistischen
Annahmen an die Regularität der Lösung. Wir setzen
hm := maxm diam(K),
K∈Th
k = max km
1≤m≤M
m mit um := u(·, t ) .
m
und em
m
h := Uh − u
Satz 5.5 (Implizites Euler-Verfahren): Für das implizite Euler-Schema in Verbindung mit
einer FE-Diskretisierung 2. Ordnung gelten die folgenden Fehlerabschätzungen:
i) Für beliebig variierende Ortsdiskretisierung:
max
1≤m≤M
kem
hk
≤ cT
1/2
max
0≤m≤M
−1/2 2
{km
hm k∇2 um k}
Z
M
X
2
km
+c
m=1
tm
tm−1
k∇∂t uk2 dt
1/2
;
(5.2.51)
ii) Im Spezialfall Vhm = Vh gleich für alle m :
max
1≤m≤M
kem
h k
≤ cT
1/2
max
0≤m≤M
{h2m k∇2 um k}
Z
M
X
2
+c
km
m=1
tm
tm−1
k∇∂t uk2 dt
1/2
.
(5.2.52)
4/3
Die Konvergenzordnung in (5.2.51) ist nicht optimal. Unter der Bedingung hm ≤ ckm ergibt
sich aber die zeit-optimale Konvergenzordnung O(km ) . Das optimale Resultat (5.2.52) läßt
−1 ≤ κ
sich auch unter den weniger einschränkenden Bedingungen Vhm−1 ⊂ Vhm oder h2m km
hinreichend klein beweisen.
Beweis: Wir bezeichnen mit Rhm u ∈ Vhm die elliptische“ Ritz-Projektion der kontinuierlichen
”
Lösung um zum Zeitlevel tm auf den Finite-Elemente-Raum Vhm , definiert durch
(∇Rhm v, ∇ϕh ) = (∇v, ∇ϕh )
∀ϕh ∈ Vhm .
(5.2.53)
Für deren Fehler gilt
kv − Rhm vk + hm k∇(v − Rhm v)k ≤ ch2m k∇2 vk.
(5.2.54)
Wir betrachten nun zunächst die Differenz ηhm := Uhm − Rhm um . Für beliebiges ϕh ∈ Vhm ist
dann unter Ausnutzung der Identität
(Uhm − Uhm−1 , ϕh ) + km (∇Uhm , ∇ϕh ) = km (f¯m , ϕh )
205
und der Projektionseigenschaft von Rhm :
(ηhm − ηhm−1 , ϕh ) + km (∇ηhm , ∇ϕh ) = km (f¯m , ϕh ) − (Rhm um −Rhm−1 um−1 , ϕh )
− km (∇Rhm um , ∇ϕh )
= km (f¯m , ϕh ) − (Rm um −Rm−1 um−1 , ϕh )
h
h
m
− km (∇u , ∇ϕh ).
Wir setzen nun ϕh := ηhm und erhalten mit Hilfe der Identität
(a − b)a = 12 a2 − 12 b2 + 21 (a − b)2
die Beziehung
m 2
1
2 kηh k
− 12 kηhm−1 k2 + 12 kηhm − ηhm−1 k2 + km k∇ηhm k2
= km (f¯m , η m ) − (Rm um − Rm−1 um−1 , η m ) − km (∇um , ∇η m )
h
h
h
h
h
= km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm )
+
+
(5.2.55)
(u − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ).
m
Weiter haben wir
km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm )
Z tm
(f − ∂t u, ηhm ) dt − km (∇um , ∇ηhm )
=
=
=
Z
tm−1
tm
tm−1
Z tm
tm−1
≤
(∇u, ∇ηhm ) dt − km (∇um , ∇ηhm )
(5.2.56)
(t − tm−1 )(∇∂t u, ∇ηhm ) dt
km k∇ηhm k2
+
1 2
4 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ 12 kηhm−1 − ηhm k2 + ch4m k∇2 um−1 k2
(5.2.57)
−1 m−1
− ηhm k2 + ckm h4m k∇2 um−1 k2
kηh
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ km
(5.2.58)
oder
i) Wir betrachten zunächst den Fall allgemein variierender Ortsdiskretisierung. Kombination der
Beziehungen (5.2.55), (5.2.56) und (5.2.57) und Absorption von Termen in die linke Seite ergibt
m 2
1
2 kηh k
− 21 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
Z tm
1 2
+ 4 km
k∂t ∇uk2 dt + ch4m k∇2 um−1 k2 .
tm−1
206
Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden
kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 )
Z tµ
m n
o
X
kµ2
+c
k∂t ∇uk2 dt + ch4µ k∇2 uµ−1 k2
tµ−1
µ=1
bzw.
kηhm k2 ≤ kηh0 k2 + 12 kηhm k2 + 21 kum − Rhm um k2 − (u0 − Rh0 u0 , ηh0 )
Z tµ
m
X
2
−1 4
kµ
k∂t ∇uk2 dt + ctm max {km
hµ k∇2 uµ k2 }.
+c
0≤µ≤m
tµ−1
µ=1
Mit Hilfe der Abschätzung
kuµ − Rhµ uµ k + kuµ − Phµ uµ k ≤ ch2µ k∇2 uµ k,
µ = 1, ..., m,
(5.2.59)
folgt
2
2 m
m
m
m m
m
kem
h k ≤ kηh k + ku − Rh u k ≤ kηh k + chm k∇ u k,
kηh0 k
0
≤ ku −
Rh0 u0 k
0
+ ku −
Ph0 u0 k
≤
ch20 k∇2 u0 k
(5.2.60)
(5.2.61)
und damit schließlich die Fehlerabschätzung (5.2.51):
2
kem
h k
≤
ctm max {kµ−1 h4µ k∇2 uµ k2 } +
0≤µ≤m
c
m
X
kµ2
µ=1
Z
tµ
tµ−1
k∇∂t uk2 dt.
(5.2.62)
ii) Wir nehmen nun an, daß Vhm = Vh bzw. Rhm = Rh für m = 1, ..., M . Kombination der
Beziehungen (5.2.55), (5.2.56) und (5.2.58) und Absorption von Termen in die linke Seite ergibt
m 2
1
2 kηh k
− 12 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
Z tm
−1 m−1
2
+ 14 km
− ηhm k2 + ckm h4m k∇2 um−1 k2 .
k∂t ∇uk2 dt + km
kηh
tm−1
Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden:
kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 )
Z tµ
m n
o
X
2
k∂t ∇uk2 dt + km h4µ k∇2 uµ−1 k2 + kµ−1 kηhµ−1 − ηhµ k2
kµ
+c
µ=1
tµ−1
bzw. mit den Abschätzungen (5.2.59), (5.2.60) und (5.2.61),
2
kem
h k
≤ ctm max
0≤µ≤m
{h2µ k∇2 uµ k2 }
+
m
X
µ=1
kµ−1 kηhµ−1
−
ηhµ k2
+c
m
X
µ=1
kµ2
Z
tµ
tµ−1
k∂t ∇uk2 dt. (5.2.63)
207
m
Im letzten Schritt schätzen wir die mittlere Summe rechts ab. Jetzt kann ϕh = ϕm
h := ηh −
m−1
ηh
∈ Vh als Testfunktion verwendet werden, und wir erhalten wie oben
m−1 2
2
m 2
2
1
1
k + 12 km k∇ϕm
kϕm
h k
h k + 2 km k∇ηh k − 2 km k∇ηh
= km (f¯m , ϕm ) − (Rm um −Rm−1 um−1 , ϕm ) − km (∇Rm um , ∇ϕm )
h
h
h
h
h
h
m
m−1
m
m
= km (f¯m , ϕm
, ϕm
h ) − (u − u
h ) − km (∇u , ∇ϕh )
+ (um − um−1 − Rh (um + um−1 ), ϕm
h ).
Weiter haben wir
m
m−1
m
m
km (f¯m , ϕm
, ϕm
h ) − (u − u
h ) − km (∇u , ∇ϕh ) =
=
=
Z
tm
tm−1
Z tm
tm−1
Z tm
tm−1
≤
m
m
(f − ∂t u, ϕm
h ) dt − km (∇u , ∇ϕh )
m
m
(∇u, ∇ϕm
h ) dt − km (∇u , ∇ϕh )
(t − tm−1 )(∇∂t u, ∇ϕm
h ) dt
m 2
1
2 km k∇ϕh k
+
1 2
2 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie
m 2
2
m
m−1 2
1
(um − um−1 − Rh (um − um−1 ), ϕm
)k
h ) ≤ 4 kϕh k + chm k∇(u − u
Z tm
2
2
≤ 14 kϕm
k∇∂t uk2 dt.
h k + chm km
tm−1
Kombination dieser Abschätzungen und Absorption von Termen in die linke Seite ergibt
Z tm
m−1 2
m 2
m 2
2
2
k∇∂t uk2 dt.
kϕh k + km k∇ηh k − km k∇ηh k ≤ {km + chm km }
tm−1
Wir wenden diese Abschätzung wieder rekursiv für m, m − 1, ..., 1 an und finden
m
X
µ=1
2
kµ−1 kϕm
h k
+
k∇ηhm k2
k∇ηh0 k2
≤
+c
m
X
µ=1
{kµ +
Mit k∇ηh0 k2 ≤ ch40 k∇2 u0 k2 folgt schließlich
m
X
µ=1
kµ−1 kηhµ
−
ηhµ−1 k2
≤
ch40 k∇2 u0 k2
+c
m
X
µ=1
{kµ +
h2µ }
Z
h2µ }
tµ
tµ−1
Z
tµ
tµ−1
k∂t ∇uk2 dt.
k∂t ∇uk2 dt.
(5.2.64)
Wir setzen dies in (5.2.63) ein und erhalten die behauptete Abschätzung (5.2.52):
2
2
2 µ 2
kem
h k ≤ ctm max {hµ k∇ u k } +
0≤µ≤m
m
X
µ=1
kµ−1 kηhµ−1 − ηhµ k2 + c
m
X
µ=1
kµ2
Z
tµ
tµ−1
k∂t ∇uk2 dt,
Q.E.D.
208
Hilfssatz 5.2 (A-priori Schranke): Für die Lösung der ARWA (5.2.46) gilt die a priori
Abschätzung
Z
−1
max k∇ uk + T
T
2
[0,T ]
0
k∇∂t uk2 dt
1/2
≤ c k∇2 u0 k + c max {kf k + k∂t f k}.
[0,T ]
(5.2.65)
Beweis: Der Beweis verwendet die Energie-Technik“, wird hier aber nicht ausgeführt. Q.E.D.
”
Wir wollen noch die Frage nach der inversen Monotonie“ der Orts-Zeit-Diskretisierung dis”
kutieren. Unter bestimmten Bedingungen an das Ortsgitter (z.B. alle Innenwinkel einer Triangulierung ω ≤ π/2 ) ist die Steifigkeitsmatrix Ah eine M-Matrix. Die Systemmatrix Mh +kAh muß
aber nicht automatisch M-Matrix sein. Um dies dennoch sicherzustellen, werden die Elemente
von Mh ,
m,j
mij = (ϕm,i
h , ϕh ),
mit Hilfe der Trapezregel ausgewertet. Bei stückweise linearen Ansätzen liefert dies eine Diagonalmatrix M̃h = Mh + O(h2 ) mit positiven Diagonalelementen, so daß M̃h + kAh M-Matrix
wird. Dieser Mass-Lumping“ genannte Prozeß erhält die Konvergenzordnung des Gesamtsche”
mas und stellt seine inverse Monotonie“ sicher (Übungsaufgabe).
”
5.2.2 Fehlerkontrolle und Schrittweitensteuerung
Zur Herleitung von a posteriori Fehlerabschätzungen erweist sich eine globale Betrachtung simultan in Ort und Zeit (ohne die bisherige Aufspaltung in Orts- und Zeitdiskretisierung) als
angemessen. Wir führen dazu das Konzept der unstetigen Galerkin-Verfahren“ für parabolische
”
ARWAn ein, als deren einfachster Spezialfall das implizite Euler-Verfahren (5.2.48) erscheinen
wird. Die Vorgehensweise entspricht der bereits von den gewöhnlichen AWAn her bekannten,
ergänzt um die Aspekte der Ortsdiskretisierung.
m
Ausgehend von oben formulierten Diskretisierungen Tm
h = {Kn } des Ortsgebiets Ω̄ und
0 = t0 < ... < tµ < ... < tM = T des Zeitintervalls I = [0, T ] führen wir die folgenden
Bezeichnungen ein (Man beachte, daß die Zeitschrittweite nicht bzgl. des Orts variiert.):
Im := (tm−1 , tm ],
k :=
max
m=1,...,M
km ,
km = tm − tm−1 ,
hm := maxm hK ,
v m± := lim v(·, tm ± s),
Qm
n :=
s↓0
Knm
× Im ,
h :=
K∈Th
max
m=1,...,M
hm ,
[v]m := v m+ − v m− ,
m
∂Qm
n := ∂Kn × Im ,
Qm := Ω × Im .
Die ARWA (5.2.46) läßt sich äquivalent schreiben in der Form
M Z
X
m=1
m−1
Im
{(∂t u, ϕ) + (∇u∇ϕ)} dt + ([u]
(m−1)+
,ϕ
Z
) = (f, ϕ) dt
(5.2.66)
I
für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung durch
die Setzung u0− := u0 berücksichtigt ist. Jede (glatte) Lösung von (5.2.46) erfüllt offenbar die
Beziehung (5.2.66), und umgekehrt muß jede Lösung von (5.2.66) in den Teilintervallen Im der
209
Wärmeleitungsgleichung genügen und bei tm auch stetig sein. Damit folgt dann wieder, daß es
sich um eine Lösung der ARWA handeln muß. Dieses Problem wird nun mit einem GalerkinAnsatz auf dem ganzen Orts-Zeit-Zylinder QT diskretisiert. Dazu führen wir die folgenden
Finite–Elemente–Räume ein:
Vh = {v : Q̄T → R| vt∈Im (·, t) ∈ Vhm , vt∈Im (x, ·) ∈ Pr (Im ), (x, t) ∈ QT }.
Die Funktionen in Vh sind also bzgl. des Ortes stückweise in Vhm (d.h. linear oder bilinear
und stetig) und bzgl. der Zeit stückweise polynomial vom Grad r (und unstetig). Der GalerkinAnsatz sucht dann Approximationen Uh ∈ Vh zu bestimmen durch die Vorschrift
M Z
X
m=1
Im
(m−1)+
{(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]m−1 , ϕh
Z
) = (f, ϕh ) dt
(5.2.67)
I
für beliebige Testfunktion ϕh ∈ Vh mit dem Anfangswert Uh0− = Ph0 u0 ( Ph0 die L2 -Projektion
auf Vh0 ). Da die Testfunktionen unstetig in der Zeit sein dürfen, zerfällt dieses formal zeitlich
global gekoppelte System in lokale Teilprobleme auf jedem Zeitstreifen Qm = Ω × Im . Dieses
Schema wird unstetiges Galerkin-Verfahren“ (abgekürzt dG(r)-Verfahren“) genannt. Wir wol”
”
len im folgenden nur den einfachsten Fall r = 0 , d.h. das dG(0)-Verfahren, betrachten. In diesem
Fall reduziert sich das globale Schema (5.2.67) auf die folgende Sequenz von lokalen Gleichungen
auf den Zeitintervallen Im , m = 1, ..., M :
Z
Z
m−1
(f, ϕh ) dt
(5.2.68)
{(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]
, ϕh ) =
Im
Im
für beliebiges ϕh ∈ Vhm . Mit der Setzung Uhm := Uhm,− ergibt sich wegen ∂t Uh ≡ 0 auf Im :
km (∇Uhm , ∇ϕh ) + (Uhm − Uhm−1 , ϕ) = km (f¯m , ϕh )
(5.2.69)
für beliebiges ϕh ∈ Vhm . Dies ist gerade das implizite Euler-Verfahren (5.2.48), welches sich also
in diesem Rahmen als dG(0)-Verfahren interpretieren läßt. Diese Sicht ändert zwar nichts am
Verfahren selbst, bietet jedoch einen systematischen Zugang zu seiner Fehleranalyse.
Bemerkung 5.1: Die dG(r)-Verfahren höheren Grades r ≥ 1 entsprechen keinem der oben
diskutierten Zeitschritt-Schemata, sie sind vielmehr Varianten gewisser impliziter Runge8 Kutta9 -Verfahren. Wir bemerken aber, daß sich auch das populäre Crank-Nicolson-Verfahren
in den Rahmen der Galerkin-Verfahren einordnen läßt. Dazu macht man einen modifizierten
Ansatz mit bzgl. der Zeit stückweise linearen, aber diesmal global stetigen Funktionen. Der
Raum der Testfunktionen ist dagegen derselbe wie beim dG(0)-Verfahren. Dies wird dann ein
Petrow-Galerkin-Verfahren“ (sog. cG(1)-Verfahren), welches sich ähnlich analysieren läßt wie
”
das dG(0)-Verfahren:
(Uhm , ϕh ) + 12 km (∇(Uhm + Uhm−1 ), ∇ϕh ) = (Uhm−1 , ϕh ) + km (f¯m , ϕh ),
(5.2.70)
für beliebige Testfunktion ϕh ∈ Vhm .
8
Carle David Tolmé Runge (1856-1927): deutscher Mathematiker; Prof. in Hannover und Göttingen; Beiträge
zur Spektraltheorie mit Anwendungen in der Atom-Physik.
9
Martin Wilhelm Kutta (1867-1944): deutscher Mathematiker; Prof. in Stuttgart; Beiträge zur Aerodynamik
und zur Numerik von Differentialgleichungen.
210
Wir wollen jetzt eine a posteriori Fehlerabschätzung für das dG(0)-Verfahren ableiten, welche
als Basis für eine simultane Anpassung des Ortsgitters und der Zeitschrittweite an den Lösungsverlauf dienen kann. Dazu setzen wir eh := Uh − u . Ein typisches Beispiel ist die Kontrolle des
+
L2 -Fehlers zum Endzeitpunkt J(eh ) := keN
h k.
Satz 5.6 (A-posteriori Fehlerschranke): Für das dG(0)-Verfahren gilt bei Kontrolle des
+
örtlichen L2 -Fehlers zum Endzeitpunkt, J(eh ) := keN
h k , die a posteriori Fehlerabschätzung
J(eh ) ≤ η(Uh ) := ci
m
X
X
µ=1
ρµn (Uh ) ωnµ (z),
(5.2.71)
µ
Kn
∈Tµ
h
mit den Residuentermen
ρµn (Uh ) := kR(Uh )kQµn + hn−1/2 k[∂n Uh ]k∂K×I µ + kµ−1/2 k[Uh ]µ−1 kKnµ ,
R(Uh ) := f − ∂t Uh + ∆Uh , und einer Interpolationskonstante“ ci . Mit der Lösung z des
”
dualen Problems“
”
−∂t z − ∆z = 0
z|∂Ω = 0, z|t=tm = kem+ k−1 em+ .
in Ω × [0, tm ],
(5.2.72)
haben die Gewichte ωnµ (z) die Gestalt:
ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn .
Beweis: Das erste Standbein“ des Beweises ist ein (parabolisches) Dualitätsargument. Wir
”
führen zunächst für ein festes tm ∈ I das (kontinuierliche) duale Problem“ ein:
”
−∂t z − ∆z = ψ
in Qm := Ω × [0, tm ],
z|∂Ω , zt=tm = χ,
(5.2.73)
∀ϕ ∈ V.
(5.2.74)
bzw. in semi-variationeller Formulierung
−(∂t z, ϕ) + (∇z, ∇ϕ) = (ψ, ϕ)
Umschreiben in die Form (5.2.66) ergibt
m nZ
X
µ=1
Iµ
µ+
{−(ϕ, ∂t z) + (∇ϕ, ∇z)} dt + (ϕ
o Z
, [z] ) =
µ
(ϕ, ψ) dt
[0,tm ]
für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung wieder
durch die Vorschrift z m+ := χ berücksichtigt ist. Durch partielle Integration in der Zeit wird
dies umgeformt zu
m nZ
X
µ=1
Iµ
µ−1
{(∂t ϕ, z) + (∇ϕ, ∇z)} dt + ([ϕ]
,z
(µ−1)+
Z
o
m+
) = (ϕ , χ) +
(ϕ, ψ) dt
(5.2.75)
[0,tm ]
für beliebige in der Zeit (stückweise) differenzierbare Testfunktion ϕ(·, t) ∈ V .
Das zweite Standbein“ des Beweises ist die Galerkin-Orthogonalität des Fehlers des dG(0)”
Verfahrens. Durch Vergleich der beiden Gleichungen (5.2.66) für u und (5.2.67) für Uh erhalten
211
wir für den Fehler eh := Uh − u die Galerkin-Orthogonalität“:
”
Z
M
X
(m−1)+
m−1
) =0
{(∂t eh , ϕh ) + (∇eh ∇ϕh )}, dt + ([eh ]
, ϕh
(5.2.76)
Im
m=1
für beliebige stetige Testfunktion ϕh (·, t) ∈ Vh .
Wir wählen nun in (5.2.75) die spezielle Testfunktion ϕ := eh und erhalten
m nZ
X
µ=1
Iµ
Z
o
,
χ)
+
{(∂t eh , z) + (∇eh , ∇z)} dt + ([eh ]µ−1 , z (µ−1)+ ) = (em+
h
(eh , ψ) dt.
[0,tm ]
Unter Ausnutzung von (5.2.76) erhalten wir damit die allgemeine Fehleridentität:
(em+
h , χ)
+
Z
(eh , ψ) dt =
[0,tm ]
m nZ
X
Iµ
µ=1
{(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt
o
+ ([eh ]µ−1 , (z − zh )(µ−1)+ )
(5.2.77)
mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir setzen nun im dualen
Problem tm = T , ψ := 0 und χ := keN + k−1 eN + . Aus der allgemeinen Fehleridentität (5.2.77)
folgt
kem+
h k=
m nZ
X
Iµ
µ=1
o
{(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt + ([eh ]µ−1 , (z − zh )(µ−1)+ ) (5.2.78)
mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir nutzen nun die Lösungseigenschaften von u und integrieren auf jeder Zelle Knm partiell bzgl. des Orts:
kem+
h k
=
m
X
X nZ
µ=1
Iµ
µ
Kn
∈Tµ
h
{(∂t u − ∂t Uh , z − zh )Knµ − (∆u − ∆Uh , z − zh )Knµ
o
− (∂n (Uh − u), z − zh )∂Knµ } dt + ([Uh − u]µ−1 , (z − zh )(µ−1)+ )Knµ .
Dies ergibt
kem+
h k=
m
X
X nZ
µ
µ=1 Kn
∈Tµ
Iµ
{(R(Uh ), z − zh )Knµ − 12 ([∂n Uh ], z − zh )∂Knµ } dt
h
o
+ ([Uh ]µ−1 , (z − zh )(µ−1)+ )Knµ ,
mit dem Residuum R(Uh ) := f − ∂t Uh + ∆Uh und dem Sprung [∂n Uh ] von ∂n Uh über die
Zellkanten. Durch Anwendung der Hölder’schen Ungleichung erhalten wir
kem+
h k≤
m
X
X n
kR(Uh )kQµn kz − zh kQµn
µ
µ=1 Kn
∈Tµ
h
o
+ 12 k[∂n Uh ]k∂Qµn kz − zh k∂Qµn } dt + k[Uh ]µ−1 kKnµ k(z − zh )(µ−1)+ kKnµ ,
(5.2.79)
212
Wir wählen nun für zh die natürliche Interpolierende Ih,k z ∈ Vh , welche zellweise definiert ist
durch die Vorschrift
Z
−1
Ih,k z|Iµ = kµ
z dt, Ih,k z|Knµ = konstante Interpolation von z.
(5.2.80)
Iµ
Dann gelten die Interpolationsabschätzungen (Beweis mit Hilfe einer Variante des BrambleHilbert-Lemmas)
kz − Ih,k zkQµn ≤ ci ωnµ (z),
hn1/2 kz − Ih,k zk∂Qµn ≤ ci ωnµ (z),
kµ1/2 k(z − Ih,k z)(µ−1)+ kKnµ ≤ ci ωnµ (z),
(5.2.81)
(5.2.82)
(5.2.83)
wobei
ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn .
Die Interpolationskonstante“ ci , welche in die a posteriori Fehlerabschätzung (5.2.71) eingeht,
”
hat dabei in der Regel die Größe ci ∼ 0, 1−1 . Einsetzen dieser Abschätzungen in (5.2.79) und
Anwendung der Schwarz’schen Ungleichung ergeben
kem+
h k ≤ ci
m
X n
X
µ
µ=1 Kn
∈Tµ
h
o
µ
−1/2
µ−1
µ
µ
kR(Uh )kQµn + h−1/2
k[∂
U
]k
+
k
k[U
]
k
n h ∂Qn
h
n
µ
Kn ωn (z),
Dies impliziert die Behauptung.
Q.E.D.
Zur konkreten Auswertung der a posteriori Fehlerabschätzung (5.2.71) müssen die Gewichte
berechnet werden. Dazu wird analog zum stationären, elliptischen Fall das duale Problem
(5.2.72) numerisch auf dem aktuellen Gitter gelöst. Mit der resultierenden diskreten dualen
Lösung zh wird dann approximiert gemäß:
ωnm (z)
ωnµ (z) ≈ ω̃nµ := kµ kkµ−1 [zh ]µ−1 kKnµ + h2n k∇2h zh kQµn ,
(5.2.84)
wobei ∇2h zh ∼ ∇2 z ein geeigneter Differenzenqotient ist. Auf der Basis der approximativen a
posteriori Fehlerabschätzung
kem+
h k ≈ η̃(Uh ) := ci
m
X
X
ρµn (Uh ) ω̃nµ (z)
(5.2.85)
µ
µ=1 Kn
∈Tµ
h
können nun simultan das Ortsgitter und die Zeitschrittweite adaptiert werden. Dabei werden in
einem iterativen Prozess die Ortsresiduen
+ h−1/2
k[∂n Uh ]k∂Qµn ,
ρm,1
n
n (Uh ) := kR(Uh )kQµ
n
und Zeitresiduen
−1/2
ρm,2
k[Uh ]µ−1 kKnµ ,
n (Uh ) := kµ
durch Anpassen von hn und km balanciert, bis η̃(Uh ) ≤ T OL für eine vorgegebene Fehlertoleranz TOL.
213
Analoge Resultate gelten für andere Fehlermaße, z.B. den globalen L2 -Fehler auf QT :
1/2
Z
keh k2 dt
J(eh ) := keh kQT =
.
(5.2.86)
I
In diesem Fall gilt die a posteriori Fehlerabschätzung (5.2.85) mit dem dualen Problem
−1/2
−∂t z − ∆z = keh kQT eh
in Ω × [0, tm ],
z|∂Ω = 0, z|t=tm = 0.
(5.2.87)
Die Wirksamkeit der adaptiven Steuerung der Ortsgitterweite auf der Basis dieser a posteriori
Fehlerabschätzungen wird anhand eines einfachen Beispiels demonstriert.
Beispiel 5.1: Wir lösen die inhomogene Wärmeleitungsgleichung
∂t u − ∆u = f
in QT ,
u|∂Ω = 0, u|t=0 = u0 ,
(5.2.88)
auf dem Einheitsquadrat Ω = (0, 1)2 . Als exakte“ Lösung wird angesetzt:
”
T
1
u(x, t) :=
, x0 := 12 + 14 cos(2πt), 21 + 14 sin(2πt) ,
0
2
1 + α|x − x |
woraus sich Anfangswert und rechte Seite ergeben zu
u0 (x) := u(x, 0),
f (x, t) := ∂t u(x, t) − ∆u(x, t).
Diese Lösungsfunktion beschreibt einen Hügel“ im Gebiet (0, 1)2 , der während des Zeitinter”
valls I = [0, 1] einmal im Kreis um den Punkt ( 12 , 12 ) herumläuft. Die Größe bzw. Steigung des
Hügels läßt sich durch Wahl des Parameters α steuern. Für den Test wird α = 50 gesetzt.
214
Abbildung 5.1: Gittersequenzen bei Kontrolle des Endzeit-L2 -Fehlers keM kΩ ; Quelle: R. Hartmann, A
posteriori Fehlerschätzung ... für die Wärmeleitungsgleichung“, Diplomarbeit 1998.
”
Abbildung 5.2: Gittersequenzen bei Kontrolle des globalen L2 -Fehlers kekΩ×I (unten); Quelle: R. Hart-
mann, A posteriori Fehlerschätzung ... bei Galerkin-Verfahren für die Wärmeleitungsgleichung“, Di”
plomarbeit 1998.
5.3 Verallgemeinerungen und Lösungsaspekte
215
Wir haben als Modellfall die Wärmeleitungsgleichung
∂t u − a∆u = f
in QT = Ω × [0, T ],
(5.3.89)
mit homogenen Dirichlet-Randbedingungen u|∂Ω = 0 und einem konstanten Diffusionskoeffi”
zienten“ a > 0 betrachtet.
i) Verallgemeinerungen:
Wir lassen nun zu, daß der Koeffizient a = a(x, t) vom Ort und von der Zeit abhängt. Das
Problem schreibt sich dann in der Form
∂t u − ∇ · {a∇u} = f
in QT = Ω × [0, T ].
(5.3.90)
Die oben betrachteten Zeitschrittverfahren lassen sich in der Regel leicht auf diesen allgemeineren
Fall übertragen. Wir wollen dies anhand des Crank-Nicolson-Verfahren diskutieren:
1 m
m−1 m−1
m
= 2 fh + fhm−1 ,
(5.3.91)
Uh
k−1 Uhm − Uhm−1 + 12 Am
h Uh + Ah
mit der Ortsdiskretisierung Ah (t) des Operators −∇ · (a(·, t)∇) . Dabei werden für Funktionen w(t) die abkürzenden Bezeichnungen wm := w(tm ) , wm−1/2 := w(tm−1/2 ) und tm−1/2 :=
1
2 (tm + tm−1 ) verwendet. Dies entspricht der sog. ”Sehnentrapezregel“; Anwendung der ”Tangententrapezregel“ führt auf das Schema:
m−1/2
m−1/2
k−1 Uhm − Uhm−1 + 12 Ah
.
Uhm + Uhm−1 = fh
(5.3.92)
Beide Verfahrensvarianten sind unbedingt stabil und von der Konvergenzordnung O(k2 + h2 ) .
Zu Ihrer Analyse ist das elegante Spektralargument aus dem vorigen Abschnitt leider nicht mehr
geeignet, da der Operator Ah (t) nun mit der Zeit variiert. Statt dessen verwendet man die flexiblere Energietechnik“ und behält im wesentlichen dieselben Aussagen wie im autonomen Fall,
”
allerdings mit wesentlich mehr Aufwand. Im (praktisch wichtigen) nichtlinearen Fall a = a(u(t))
wird zweckmäßigerweise die Tangententrapezform des Crank-Nicolson-Schemas verwendet:
k−1 Uhm − Uhm−1 + Ah
m
1
2 (Uh
Hier ist auch die BDF(2)-Formel gut anwendbar:
m−1/2
.
+ Uhm−1 ) = fh
2k−1 3Uhm − 4Uhm−1 + Uhm−2 + Ah (Uhm ) = fhm .
(5.3.93)
(5.3.94)
Eine Stabilitäts- und Konvergenzanalyse steht aber außerhalb des Rahmens dieser Vorlesung.
ii) Berechnung der Startwerte:
Bei der Durchführung jedes Zeitschritts ist die rechte Seite aufzubauen, welche die Information
vom vorausgehenden Zeitlevel beinhaltet. Dabei ist unter Umständen eine L2 -Projektion auf das
aktuelle Gitter vorzunehmen.
a) Anfangswert: Die Auswertung des Anfangswerts Uh0 kann meist durch einfache, lokale Interpolation (oder Restriktion) des kontinuierlichen Anfangswerts u0 auf das Gitter erfolgen. Im
Fall eines irregulären Anfangswerts, etwa u0 ∈
/ C(Ω̄) , ist jedoch Vorsicht geboten. Zur Gewährleistung der vollen Glättungseigenschaft“ der Diskretisierung (im Ort sowie in der Zeit) sollte
”
216
Uh0 als L2 -Projektion ausgewertet werde gemäß:
(Uh0 , ϕh ) = (u0 , ϕh ) ϕh ∈ Vh .
(5.3.95)
b) Ortsgitterwechsel: Verändert sich die Ortsdiskretisierung vom Zeitlevel tm−1 zum Zeitlevel
tm , so muß die vorausgehende Näherung Uhm−1 ∈ Vhm−1 auf das neue Gitter transferiert werden.
Im FE-Kontext geschieht dies zwangsläufig gemäß
(Uhm−1 , ϕh ) ∀ϕh ∈ Vhm ,
(5.3.96)
was gleichbedeutend mit der Auswertung der L2 -Projektion Phm Uhm−1 ∈ Vhm ist. Dieser unscheinbare Schritt kann unter Umständen die teure“ Komponente des ganzen Lösungsprozesses
”
und Tm
sein. Dies ist dann der Fall, wenn die beiden Gitter Tm−1
h völlig unabhängig vonh
einander erzeugt werden. Zur Auswertung von (5.3.96) müssen Zellintegrale über Produkte von
Knotenbasisfunktionen berechnet werden:
Z
ϕm−1,j
ϕm,n
dx.
h
h
m
Kn
Normalerweise geschieht dies mit Hilfe von Quadraturformeln. Da die Funktion ϕm−1,j
auf der
h
Zelle Knm aber in der Regel nur stückweise glatt ist, wäre das zu ungenau. Der dadurch in
jedem Zeitschritt eingeschleppte Fehler würde im Verlaufe der Rechnung akkumulieren und das
Ergebnis stark verfälschen. Die Verwendung von Quadraturformeln besonders hoher Ordnung
(z.B. 3 × 3-Gauß-Formeln) behebt diese Schwierigkeit nicht, da letztere zur Erreichung ihrer
hohen Genauigkeit natürlich auch eine entsprechend hohe Regularität des Integranden benötigen.
Gerade diese ist aber im betrachteten Fall nicht gegeben. Es gibt im wesentlichen drei Wege zur
Lösung dieses technischen Problems:
- Es werden summierte“ Quadraturformeln auf den einzelnen Zellen Knm verwendet; etwa
”
durch Unterteilung in 4 − 16 Unterzellen. Dies erhöht zwar nicht die Ordnung der Integration,
vermindert aber die relevante Fehlerkonstante.
- Die Integration wird für den stückweise polynomialen Integranden exakt“ durchgeführt. Dazu
”
ist die Bestimmung aller Teilstücke von Knm erforderlich, auf denen ϕm−1,j
glatt ist. Dies wird
h
bei, unstrukturierten Gittern in 3-D allerdings sehr aufwendig.
- Gehören die Gitter Tm−1
und Tm
h zu einer Familie von hierarchisch verfeinerten Gittern,
h
kann diese strukturelle Information zur effizienten Berechnung der Integrale verwendet werden,
da die Lage der kritischen Knicklinien von ϕm−1,j
durch die reguläre Verfeinerung bestimmt
h
ist.
iii) Lösungskomplexität:
Wir betrachten wieder den Modellfall der homogenen Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ⊂ R2 ,
∂t u − ∆u = 0
in QT ,
(5.3.97)
welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei.
(i) Explizite Verfahren (etwa das explizite Euler-Schema) erfordern in jedem Zeitschritt eine
Matrix-Vektor-Multiplikation mit einem arithmetischen Aufwand O(N ) . Die Stabilitätsbedingung k ≤ ch2 erzwingt etwa M ∼ h−2 ∼ N Zeitschritte pro Zeiteinheit. Dies bedeutet einen
217
Gesamtaufwand von O(N 2 ) OP.
(ii) Implizite Verfahren erfordern in jedem Zeitschritt die Lösung eines linearen Gleichungssystems, erlauben aber größere Zeitschritte. Zur Überbrückung einer Zeiteinheit sind aus Genauigkeitsgründen in der Regel M ∼ h−1 Zeitschritte erforderlich. Wir diskutieren exemplarisch
das Crank-Nicolson-Verfahren. Bei zeilenweiser Numerierung der Gitterpunkte haben die resultierenden Gleichungssysteme
(Ih + 21 akAh )U m = (Ih − 12 akAh )U m−1
(5.3.98)
die Koeffizientenmatrix Lh := Ih + 12 akAh , wobei wieder

Bm −Im

 −Im Bm −Im

Ah = 

−Im Bm

..
.









. .  N
. 



..

.
Bm







 −1

4
−1


=

. .  m

. 
−1
4




.. ..

.
.

4 −1
mit der m×m-Einheitsmatrix Im . Die Eigenwerte dieser Matrix sind gegeben durch:
λkl (Lh ) = 1 + 21 akh−2 {4 − 2(cos(khπ) + cos(lhπ))},
k, l = 1, ..., m.
Damit ergibt sich ihre Spektralkondition zu
cond2 (Lh ) =
1 + 4akh−2
λmax (Lh )
∼
.
λmin (Lh )
1 + akπ 2
(5.3.99)
Wir haben also unterschiedlich kritische Konditionierung abhängig von der Relation zwischen k
und h . Im Hinblick auf eine Balancierung von Orts- und Zeitfehler ist die Wahl k ∼ h sinnvoll.
In diesem Fall ist dann
κ2 (Lh ) = O(h−1 ).
(5.3.100)
Im parabolischen Fall ist in der Regel die Konditionierung der zu lösenden impliziten Gleichungssysteme also weniger kritisch als bei elliptischen Problemen. Bei Einhaltung der (natürlich unrealistischen) Schrittweitenrelation k ∼ h2 wird sogar κ2 (Lh ) = O(1) , und der Lösungsaufwand
der impliziten Verfahren nähert sich dem der expliziten.
Zur Lösung des Systems (5.3.98) können alle oben diskutierten Methoden verwendet werden. Da sich im autonomen Fall die Matrix Lh von Zeitschritt zu Zeitschritt nicht ändert, bietet
sich die direkte Lösung mit Hilfe einer einmaligen Cholesky-Zerlegung zu Beginn der Rechnung
an (wenn dies speichertechnisch möglich ist). Dieser Ansatz erfordert es aber, den Zeitschritt
k konstant zu halten, was in den meisten praktischen Fällen nicht ökonomisch ist. Im allgemeinen muß in jedem Zeitschritt eine neue“ Matrix invertiert werden, was die Verwendung
”
iterativer Lösungsverfahren impliziert. Dabei steht mit Uhm−1 ein meist recht guter Startwert
zur Verfügung. Bei Verwendung eines Mehrgitterverfahrens bietet sich daher die Organisation
im F-Zyklus an. Häufig ist wegen der vergleichsweise moderaten Konditionierung der Matrizen
Lh (bei kleiner Zeitschrittweite) zu ihrer Invertierung ein normales CG-Verfahren ausreichend
schnell, so daß sich der Einsatz der komplizierten Mehrgitteriteration erübrigt. Dies hängt aber
sehr von der jeweiligen konkreten Situation ab.
218
iv) Splitting-Methoden (ADI-Verfahren):
In höheren Raumdimensionen ist die Lösung der Gleichungssysteme in jedem Zeitschritt eines
impliziten Verfahrens kostspielig und kann Rechnungen über sehr lange Zeitintervalle T ≫ 1
unmöglich machen. Der Übergang zu expliziten Schemata ist in der Regel wegen der damit verbundenen Zeitschrittrestriktion auch nicht sinnvoll. In dieser Situation stellen die sog. Splitting”
Methoden“ eine attraktive Alternative dar. Diese zerlegen die Lösung der vollen d-dimensionalen
Gleichungssysteme in eine Folge von tridiagonalen Systemen (wie im 1-dimensionalen Fall), welche mit optimaler O(N )-Komplexität gelöst werden können. Ein Vertreter dieses Verfahrenstyps
ist das ADI-Verfahren“ (Alternating Direction Implicit Iteration) nach Peaceman-Rachford,
”
welches wir bereits im Zusammenhang mit iterativen Lösungsverfahren für spezielle separable“
”
Gleichungssysteme kennengelernt haben. Bei mehrdimensionalen, parabolischen Problemen wird
es nun als Diskretisierungsverfahren eingesetzt.
Wir betrachten wieder die Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ,
∂t u − a∆u = 0
in QT ,
(5.3.101)
welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei.
Bei zeilenweiser Numerierung der Gitterpunkte haben die aus dem Crank-Nicolson-Verfahren
resultierenden Gleichungssysteme die Gestalt
(Ih + 12 akAh )U m = (Ih − 21 akAh )U m−1 .
(5.3.102)
Der Differenzenoperator Ah wird auf dem kartesischen Tensorprodukt-Gitter in seine Bestandteile bzgl. der einzelnen Koordinatenrichtungen zerlegt gemäß
Ah = Ah,1 + Ah,2 .
Entsprechend erhält das Gleichungssystem (5.3.102) des Crank-Nicolson-Schemas die Form
(Ih + 12 ak(Ah,1 + Ah,2 ))U m = (Ih − 12 ak(Ah,1 + Ah,2 ))U m−1
m−1/2
Die Ah,i sind Tridiagonalmatrizen. Es wird dann unter Einführung von Zwischenwerten Uh
wie folgt iteriert:
m−1/2
(Ih + 12 akAh,1 )Uh
= (Ih − 21 akAh,2 )Uhm−1
m−1/2
(Ih + 12 akAh,2 )Uhm = (Ih − 21 akAh,1 )Uh
.
Die ADI-Methode kann als ein Mehrschritt-Differenzenschema interpretiert werden, wobei allerdings die Zwischenwerte keine physikalische Relevanz haben. In jedem Teilschritt müssen
Gleichungssysteme mit Tridiagonalgestalt gelöst werden. Wir wissen bereits von der Diskussion der iterativen Lösungsverfahren, daß der ADI-Algorithmus für jeden Wert des Parameters
ak > 0 gegen die Lösung Uh∞ des Gleichungssystems Ah Uh∞ = 0 konvergiert. Dies ist auch
physikalisch“ sinnvoll, da ja im homogenen Fall ( f ≡ 0 ) auch für die exakte Lösung gilt
”
u(t) → 0 (t → ∞) . Damit erweist sich das ADI-Verfahren automatisch als unbedingt numerisch
m−1/2
erhalten wir
stabil. Durch Elimination des Zwischenwertes Uh
(I + 21 kAh,1 )(I + 12 kAh,2 )Uhm = (I − 12 kAh,1 )(I − 21 kAh,2 )Uhm−1 .
(5.3.103)
219
Der Abschneidefehler dieser Differenzenformel erlaubt die Abschätzung
n
o
m
|τh,k
| ≤ c k2 max |∂t3 u| + h2 max |∇4 u| .
Q̄T
Q̄T
(5.3.104)
Eine Konvergenzanalyse ist leicht möglich, wenn wir wieder annehmen, daß die Zerlegungsmatrizen Ah,1 und Ah,2 kommutieren, d.h.: Ah,1 Ah,2 = Ah,2 Ah,1 . In diesem Fall besitzen sie ein
gemeinsames ONS von Eigenvektoren {v (n) , n = 1, ..., N } zu Eigenwerten λn = λn (Ah,1 ) und
µn = µn (Ah,2 ) . Die Koeffizienten in der Entwicklung
Uhm =
N
X
(n)
αm
ν v
ν=1
werden dann durch das ADI-Schema wie folgt fortgepflanzt
αm
n =
(1 − 21 kλn )(1 − 12 kµn ) m−1
αn .
(1 + 21 kλn )(1 + 12 kµn )
(5.3.105)
Hieraus folgt wieder, analog zum Crank-Nicolson-Schema, direkt die unbedingte Stabilität des
ADI-Schemas. Für die Fourier-Koeffizienten αn (t) der örtlich semi-diskreten Approximation
uh (t) gilt
αn (tm ) = e−k(λn +µn ) αn (tm−1 ).
(5.3.106)
Aus der Beziehung für z = z1 + z2 , zi ≤ 0 ,
1 + 21 z1 1 + 21 z2 z1
·
= e + O(|z1 |3 ) ez2 + O(|z2 |3 ) = ez + O(|z|3 )
1
1
1 − 2 z1 1 − 2 z2
(5.3.107)
erhält man durch Adaption des Arguments, welches bei der Konvergenzanalyse der Padé-Verfahren
verwendet wurde, den folgenden Satz.
Satz 5.7 (ADI-Verfahren): Angewendet auf die 5-Punkte-Diskretisierung der Wärmeleitungsgleichung auf dem Einheitsquadrat ist das ADI-Verfahren für jede Zeitschrittweite k stabil und
mit 2. Ordnung konvergent:
m
m
2
3
2
4
kUh − u kh ≤ c k max |∂t u| + h max |∇ u| .
(5.3.108)
Q̄T
Q̄T
Beweis: Der Beweis bedient sich wieder der Spektralmethode.
Q.E.D.
Der ADI-Ansatz ist generell auf (kartesischen) Tensorproduktgittern in beliebigen Raumdimensionen möglich, wenn der zugrunde liegende Differentialoperator separabel“ ist, d.h. additiv
”
in eindimensionale Operatoren zerfällt, wie z.B. der Operator
Lu = −∂12 u − ∂22 u + ∂1 u + ∂2 u + u.
In allgemeineren Situationen (z.B. bei Auftreten gemischter Ableitungen ∂1 ∂2 u oder auf unstrukturierten Gittern) sind additive Zerlegungen von Ah in tridiagonale Teilmatrizen nicht
mehr möglich, und der Wert des ADI-Ansatzes wird zweifelhaft.
220
5.4 Übungen
Übung 5.1: Das implizite Euler-Verfahren angewendet auf eine FE-Diskretisierung des (homogenen) Wärmeleitungsproblems
∂t u − ∆u = 0,
t ≥ 0,
u|t=0 = u0 ,
u|∂Ω = 0,
mit linearen oder bilinearen Ansatzfunktionen führt auf eine Folge von linearen Systemen
Mh U m + kAh U m = Mh U m−1 ,
m ≥ 1,
U 0 = Ph u0 ,
mit der zugehörigen Massematrix Mh und Steifigkeitsmatrix Ah . Man zeige:
a) Die Auswertung der Elemente der Massematrix mit der Trapezregel ergibt eine Diagonalmatrix (sog. “Masse-Lumping”).
b) Auf Triangulierungen ohne stumpfe Innenwinkel ist die durch Masse-Lumping entstehende
Systemmatrix M̃h + kAh diagonal-dominant und vom nicht-negativen Typ, d.h. eine M-Matrix.
c) Anspruchsvolle Zusatzaufgabe: Der Lumping-Prozeß bewirkt einen Zusatzfehler der Größe
|Ũ m − U m | = O(h2 ) .
Übung 5.2: Man leite eine Bedingung für die L2 –Stabilität sowie die L∞ -Stabilität des Wärmeleitungsproblems aus Aufgabe 13.1 auf dem Einheitswürfel im R3 her. Die Ortsdiskretisierung
erfolge mit dem 7-Punkte-Differenzenoperator auf einem (äquidistanten) kartesischen Gitter mit
Gitterweite h . (Hinweis: Man übertrage die Argumentation aus der Vorlesung von zwei auf drei
Raumdimensionen.)
Übung 5.3: Die Wärmeleitungsgleichung
∂t u − a∆u = f, t ≥ 0,
ut=0 = u0 ,
u|∂Ω = 0,
auf einem Polygongebiet Ω ⊂ R2 mit Wärmeleitkoeffizient a > 0 werde im Ort mit einem
linearen Finite-Elemente-Ansatz auf einer quasi-gleichförmigen Folge von Triangulierungen der
Gitterweite h und in der Zeit mit dem impliziten Euler-Schema mit Schrittweite k diskretisiert:
Mh U m + kAh U m = Mh U m−1 + kbm ,
m ≥ 1,
U 0 = Ph u0 .
Man untersuche die Abhängigkeit der Konditionierung der zugehörigen Systemmatrix Mh +kAh
von den Diskretisierungsparametern h und k . (Hinweis: Man betrachte zunächst den Spezialfall,
daß Ω das Einheitsquadrat mit einem gleichförmigen Rechteckgitter ist und die Massematrix
Mh unter Anwendung der Trapezregel (“Masse-Lumping”) nur näherungsweise berechnet wird.)
6 Verfahren für hyperbolische Probleme
Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung hyperbolischer Anfangs-Randwert-Aufgaben (ARWAn). Der Übersichtlichkeit halber beschränken wir
uns dabei auf das Modellproblem der Wellengleichung in einer Ortsdimension mit Dirichletschen
Randbedingungen, d.h. auf die 1. ARWA:
∂t2 u − c2 ∂x2 u = f
in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
0
(6.0.1)
0
u(x, 0) = u , ∂t u(x, 0) = v ,
bzw. deren örtlich zweidimensionales Analogon
∂t2 u − c2 ∆u = f
u|∂Ω = 0,
in QT := Ω × [0, T ],
0
(6.0.2)
0
u|t=0 = u , ∂t u|t=0 = v .
Das Definitionsgebiet Ω wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, u0 , v 0 sind ebenfalls glatt und kompatibel, so daß die Lösung
ebenfalls als glatt angenommen werden kann. Unsere theoretischen Überlegungen haben gezeigt,
daß bei hyperbolischen Problemen Irregularitäten in den Anfangsdaten oder der rechten Seite
entlang der Charakteristiken fortgepflanzt werden. Im Gegensatz zu den elliptischen und parabolischen Problemen besitzen hyperbolische keinerlei Glättungseigenschaft“. Lokale Störungen
”
(bzw. Wellen) werden ungedämpft fortgeplanzt. Insbesondere gilt das Prinzip der Energieer”
haltung“, d.h.: Für f ≡ 0 bleibt die Gesamtenergie (Summe aus kinetischer und elastischer
Energie) in der Zeit erhalten:
k∂t u(t)k2 + c2 k∇u(t)k2 = kv 0 k2 + c2 k∇u0 k2 .
(6.0.3)
Diese charakteristische Eigenschaft sollten auch Diskretisierungen der Wellengleichung besitzen.
6.1 Differenzenverfahren für hyperbolische Probleme
Wir beginnen mit der örtlich eindimensionalen, homogenen Wellengleichung
∂t2 u − c2 ∂x2 u = 0 in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
(6.1.4)
u(x, 0) = u0 , ∂t u(x, t) = v 0 .
Auf einem (äquidistanten) Orts-Zeit-Gitter {xn = nh, tm = mk} mit Ortsgitterweite h sowie
Zeitschrittweite k lautet die natürliche, zentrale Differenzenapproximation 2. Ordnung
m−1
m−1
k−2 {Unm − 2Unm−1 + Unm−2 } − c2 h−2 {Un−1
− Unm−1 + Un+1
}
(6.1.5)
zur Bestimmung der Approximationen Unm ∼ u(xn , tm ) . Dies ist eine (explizite) Zweischrittformel“.
”
Die Startwerte Un0 und Un1 werden aus den Anfangsbedingungen berechnet gemäß:
Un0 := u0 (xn ),
221
222
Verfahren für hyperbolische Probleme
sowie unter Beachtung von
u(xn , k) = u(xn , 0) + k∂t u(xn , 0) + 21 k2 ∂t2 u(xn , 0) + ...
= u0 (xn ) + kv 0 (xn ) + 12 c2 k2 ∂x2 u0 (xn ) + ...
durch
Un1 = u0 (xn ) + kv 0 (xn ) + 12 c2 k2 h−2 {u0 (xn−1 ) − 2u0 (xn ) + u0 (xn+1 )}.
Mit dem Quotienten σ := k/h gilt für den zugehörigen Abschneidefehler:
τh,k = {∂t2 u − c2 ∂x2 u} +
1 2 2
12 h (σ
− c−2 )∂t4 u +
1 4 4
360 h (σ
− c−4 )∂t6 u + ....
Offenbar ist τh,k ≡ 0 für σ = c−1 , d.h.: Die explizite Differenzenformel
m−1
m−1
Unn = Un−1
+ Un+1
− Unm−2
ist eine exakte“ Differenzendarstellung der Wellengleichung. Das Abhängigkeitsgebiet der Dif”
ferenzenformel hängt offenbar von der Schrittweitenrelation σ = k/h ab.
1. Fall 0 < σ ≤ c−1 : Abhängigkeitsgebiet der Differenzenformel enthält das der Differentialgleichung;
2. Fall σ = c−1 : Übereinstimmung“;
”
3. Fall σ > c−1 : Abhängigkeitsgebiet der Differenzenformel ist enthalten in dem der Differentialgleichung.
Satz 6.1 (Courant1 -Friedrichs2 -Lewy3 ): Notwendig für die Konvergenz
Unm → u(xn , tm )
(h, k → 0),
für beliebige Anfangsdaten ist die Schrittweitenbedingung ( CFL-Bedingung“)
”
k
σ := ≤ c−1 .
h
(6.1.6)
(6.1.7)
Beweis: Sei σ > c−1 . Wenn in irgendeinem festen Gitterpunkt (xn , tm ) für eine spezielle
Anfangsbedingung Unm → u(xn , tm ) konvergiert für h, k → 0 , so können wir diese Anfangsdaten
außerhalb des Abhängigkeitsintervalls von (xn , tm ) bzgl. der Differenzenformel beliebig ändern,
ohne daß Unm verändert wird. In diesem Fall kann also Unm nicht gegen die veränderte Lösung
ũ(xn , tm ) konvergieren.
Q.E.D.
Bemerkung 6.1: Wir weisen darauf hin, daß für spezielle Anfangsdaten durchaus (theoretische) Konvergenz auch für σ > c−1 eintreten kann; in diesem Fall liegt aber numerische Instabilität vor. Die Schrittweitenbedingung (6.1.7) ist weniger restriktiv als die entsprechende
Bedingung k ≤ 12 ah2 bei der Wärmeleitungsgleichung.
Im folgenden werden wir die Konvergenz des Differenzenschemas (6.1.5) untersuchen. Dabei
bedienen wir uns der Spektraltechnik, die wir bereits bei parabolischen Problemen kennengelernt
223
haben. Der örtliche Differenzenoperator
Ah Unm := −
c2
m
}
{U m − 2Unm + Un+1
h2 n−1
(6.1.8)
m
( U0m = UN
+1 = 0 ) ist symmetrisch und positiv definit bzgl. des diskreten Skalarprodukts
(v, w)h := h2
N
X
vn wn ,
n=1
1/2
kvkh := (v, v)h .
Seine Eigenwerte seien 0 < λ1 ≤ ... ≤ λN ∼ 4c2 /h2 mit einem zugehörigen Orthonormalsystem
{w(n) , n = 1, ..., N } von Eigenvektoren. Insbesondere gilt
(Ah v, v)h ≥ λkvk2h
(6.1.9)
mit einer von h unabhängigen Konstante λ > 0 .
Satz 6.2 (CFL-Bedingung): Die explizite Differenzenformel (6.1.5) ist genau dann numerisch stabil, wenn die CFL-Bedingung k/h ≤ c−1 erfüllt ist. Im Falle einer hinreichend glatten
Lösung gilt dann die Konvergenzabschätzung
max kUhm − u(·, tm )kh ≤ c(u)T 2 {k2 + h2 }.
[0,T ]
(6.1.10)
Beweis: i) Für die Entwicklungskoeffizienten in
Uhm =
N
X
(n)
am
nw
n=1
gilt
m−1
=0
+ k2 λn am−1
+ am−2
am
n
n
n − 2an
bzw.
2
m−1
am
+ am−2
= 0.
n + (k λn − 2)an
n
(6.1.11)
Diese homogene Differenzengleichung hat die allgemeine Lösung
m
m
am
n = c1 r1 + c2 r2
mit den Wurzeln ri des charakteristischen Polynoms ρ(r) = r 2 + (k2 λn − 2)r + 1 :
p
2 − k2 λn ± (2 − k2 λn )2 − 4
r1,2 =
.
2
Im Fall k2 λn ≤ 4 ist |r1,2 | ≤ 1 , d.h.: Es liegt Stabilität vor. Im Fall k2 λn > 4 ist |r2 | > 1 ,
d.h.: Es besteht Instabilität. Offenbar gilt für h → 0 :
k 2 λn ≤ 4
⇔
σ ≤ c−1 .
(6.1.12)
224
ii) Sei nun k2 λn ≤ 4 und die Lösung u glatt. Wir betrachten den Fehler der Ortsdiskretisierung
getrennt von dem der Zeitdiskretisierung:
m
m
m
em
n := u(xn , tm ) − Un = u(xn , tm ) − uh (xn , tm ) + uh (xn , tm ) − Un =: εh (xn , tm ) + En .
Für den Ortsdiskretisierungsfehler εh gilt ε0h = ∂t ε0h = 0 und
∂t2 εh + Ah εh = O(h2 ).
Wir multiplizieren diese Identität mit ∂t εh ,
2
2
1
2 dt k∂t εh kh + (Ah εh , εh )h = (O(h ), ∂t εh )h ,
und integrieren über [0, t] :
k∂t εh (t)k2h
Dies impliziert
+ (Ah εh (t), εh (t))h =
kεh (0)k2h
+ (Ah εh (0), εh (0))h +
Z
t
(O(h2 ), ∂s εh )h ds.
0
max k∂t εh k2h + (Ah εh , εh )h ≤ t O(h2 ) max k∂t εh kh
[0,t]
[0,t]
bzw. nach Aufintegrieren bzgl. der Zeit:
max kεh kh ≤ c t2 h2 .
[0,t]
(6.1.13)
Der Faktor t2 läßt sich hier nicht vermeiden, da bei der Wellengleichung (im Gegensatz zur
Wärmeleitungsgleichung) lokale Störungen nicht ausgedämpft werden.
iii) Für den Zeitdiskretisierungsfehler gilt
k−2 {E m − 2E m−1 + E m−2 } + Ah E m−1 = O(k2 ).
(6.1.14)
Die Konstante in O(k2 ) hängt dabei von den Zeitableitungen von uh (t) bis zur Ordnung 4 ab.
Diese lassen sich durch die entsprechenden Zeitableitungen von u beschränken, was hier jedoch
nicht ausgeführt werden soll. Für die n-te Fourier-Komponente Enm = (E m , w(n) )h gilt
Enm − 2Enm−1 + Enm−2 + k2 λn Enm−1 = (O(k4 ), w(n) )h ,
gleichmäßig bzgl. n . Das charakteristische Polynom dieser Differenzengleichung ist ρ(r) = r 2 +
(k2 λn − 2)r + 1 mit Wurzeln |r1,2 | = 1 . Die a priori Abschätzung für Lösungen inhomogener
Differenzengleichungen aus Hilfssatz 6.1 liefert also:
n
o
|Enm | ≤ c max |Enν | + m2 max O(k4 )
µ=0,1
bzw.
kE m k2h
=
m
X
ν=1
ν=2,...,m
|Enν |2 ≤ c kE 0 k2h + kE 1 k2h + ct4m k4 .
225
Offenbar ist E 0 = 0 und
E 1 = uh (t1 ) − U 1 = uh (t1 ) − u0 − ku1 − 12 k2 Ah u0
= −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 c2 ∂x2 u(0) + O(k2 h2 )
= −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 ∂t2 u(0) + O(k2 h2 )
= O(k3 + k2 h2 ) + O(k3 ).
Dies führt auf
kE m k2h ≤ c t2m {h2 + k2 }2 .
(6.1.15)
Kombination der Abschätzungen (6.1.13) und (6.1.15) vervollständigt schließlich den Beweis.
Q.E.D.
Hilfssatz 6.1 (Differenzengleichungen): Die Folge {ym }m∈N genüge der linearen, inhomogenen Differenzengleichung
R
X
aν ym+ν = gm ,
ν=0
m ≥ 0.
(6.1.16)
Wenn alle Nullstellen λν des charakteristischen Polynoms
ρ(z) :=
R
X
aν z ν
ν=0
Betrag |λν | ≤ 1 haben, gilt die a priori Abschätzung
max |yν | ≤ cR max |yν | + m2 max |gν | ,
R≤ν≤m
0≤ν≤R
0≤ν≤m
m ≥ R.
Beweis: ohne
(6.1.17)
Q.E.D.
Bemerkung 6.2: Die bisher erhaltenen Aussagen bleiben gültig, wenn man das explizite Differenzenschema auf das reine Anfangswertproblem ( Cauchy-Problem“) der Wellengleichung an”
wendet. In diesem Fall ist man auf explizite Verfahren angewiesen, da zur Verwendung impliziter
Formeln die notwendigen Randwerte fehlen.
Bei der ARWA der Wellengleichung kann man sich von der einschränkenden CFL-Bedingung
durch Verwendung impliziter Differenzenformeln befreien, etwa der Art
=0
k−2 {Uhm − 2Uhm−1 + Uhm−2 } + αAh Uhm + (1 − 2α)Ah Uhm−1 + αAm−2
h
mit einem Parameter α ∈ [0, 1] . Diese Formel hat den Abschneidefehler
o
n
1
(σ 2 − 1) − ασ 2 }∂x4 u + O(h2 ) ;
τh = h2 { 12
(6.1.18)
Sie ist also für beliebiges α von zweiter Ordnung. Für ein implizites Differenzenschema enthält
ihr Abhängigkeitsbereich offensichtlich den der Differentialgleichung.
226
Satz 6.3 (Konvergenz impliziter Verfahren): Die implizite Differenzenformel (6.1.18) ist
im Falle α ≥ 1/4 unbedingt stabil und im Fall 0 < α < 1/4 stabil für
1
0<σ≤ √
;
c 1 − 4α
(6.1.19)
Für andere σ ist sie instabil. Im stabilen Fall gilt die Konvergenzabschätzung
max kUhm − u(·, tm )kh ≤ c(u)T {k2 + h2 }.
[0,T ]
(6.1.20)
Beweis: Für die Entwicklungskoeffizienten in
Uhm =
N
X
(n)
am
nw
n=1
gilt
m−1
m−1
am
+ am−2
+ k2 λn {αam
+ αam−2
} = 0.
n − 2an
n
n + (1 − 2α)an
n
Das charakteristische Polynom dieser Differenzenformel
hat die Wurzeln
ρ(r) = (1 + αk2 λn )r 2 + k2 λn (1 − 2α) − 2 r + (1 + k2 λn α)
r1,2 =
2 − k2 λn (1 − 2α) ±
p
(k2 λn (1 − 2α) − 2)2 − 4(1 + k2 λn α)2
.
2(1 + αk2 λn )
Wir haben zwei Fälle zu unterscheiden:
a) Stabiler Fall:
(k2 λn (1 − 2α) − 2)2 ≤ 4(1 + k2 λn α)2
⇒
|r1,2 | = 1.
(6.1.21)
(k2 λn (1 − 2α) − 2)2 > 4(1 + k2 λn α)2
⇒
|r2 | > 1.
(6.1.22)
b) Instabiler Fall
Der Kette äquivalenter Ungleichungen
k2 λn (1 − 2α) − 2 ≤
k2 λn − 2αk2 λn ≤ 4 + 2αk2 λn
k2 λn − 4αk2 λn ≤ 4
4k2 c2
(1 − 4α) ≤ 4
h2
k2
(1 − 4α) ≤ c−2
h2
2 + 2k2 λn α
227
entnehmen wir die Bedingungen α ≥ 1/4 oder
0 < α < 1/4,
1
σ≤ √
.
c 1 − 4α
(6.1.23)
Dagegen ist
k2 λn (1 − 2α) − 2 ≥ −2 − 2k2 λn α
k2 λn − 2αk2 λn ≥ −2αk2 λn
k2 λn ≥ 0,
stets erfüllt.
Dies beweist den die Stabilität betreffenden Teil des Satzes. Die Konvergenzabschätzung
wird dann ähnlich wie im expliziten Fall gezeigt. Wir lassen die Details weg.
Q.E.D.
In zwei Raumdimensionen ist der Abhängigkeitsbereich der Wellengleichung kegelförmig
(z.B. Kreiskegel bei kreisförmigem Grundgebiet). Die obigen Aussagen für den eindimensionalen
Fall gelten sinngemäß auch in zwei Dimensionen. Bei Ortsdiskretisierung mit dem 5-PunkteOperator Ah lautet das Analogon des expliziten Schemas (6.1.5)
(6.1.24)
k−2 Uhm − 2Uhm−1 + Uhm−2 + c2 Ah Uhm−1 = 0
und hat die Stabilitätsbedingung
1
σ≤√ .
2c
√
In drei Raumdimensionen verschärft sich diese Bedingung zu σ ≤ ( 3c)−1 .
(6.1.25)
228
6.2 Finite-Elemente-Verfahren für hyperbolische Probleme
Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von
(6.0.2):
(∂t2 u, ϕ) + (a∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(6.2.26)
mit dem üblichen Sobolew-Raum V := H01 (Ω) . Im Sinne der Rothe-Methode“ könnten diese
”
Gleichung nun zunächst wieder mit einem Differenzenschema 2. Ordnung in der Zeit und anschließend die einzelnen Zeitschritte mit FE-Ansätzen im Ort diskretisiert werden. Dies führt
wie bei den Differenzenverfahren zwangsläufig auf Zwei-Schritt-Schemata, mit denen die Energieerhaltung nicht zu bewerkstelligen ist. Wir wollen daher jetzt einen anderen Weg beschreiten,
der etwas näher an der Vorgehensweise bei parabolischen Problemen ist. Durch Einführung der
zusätzlichen Unbekannten v = ∂t u geht die Wellengleichung über in das System
∂t u − v = 0,
∂t v − c2 ∆u = f,
mit den natürlichen Randbedingungen u|∂Ω = v|∂Ω = 0 sowie den Anfangsbedingungen u|t=0 =
u0 und v|t=0 = v 0 . In variationeller Form schreibt sich dies wie
(∂t v, ϕ) − (v, ψ) = 0 ∀ψ ∈ V, t ∈ [0, T ],
(∂t u, ψ) + c2 (∇u, ∇ϕ) = (f, ϕ),
∀ϕ ∈ V,
mit den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . Dieses System von Differentialgleichungen ist wieder hyperbolisch“, da alle Eigenwerte der Koeffizientenmatrix rein imaginär
”
sind. Zur Diskretisierung wäre also ein Zeitschrittverfahren günstig, bei dem die imaginäre Achse
gerade der Rand des Stabilitätsgebiets ist. Das Crank-Nicolson-Verfahren besitzt diese Eigenschaft.
Zur Diskretisierung dieses Systems verwenden wir das Rothe-Verfahren, d.h.: Zunächst wird
bzgl. der Zeit diskretisiert. Dazu verwenden wir auf einem Zeitgitter
0 = t0 < t1 < ... < tm < ... < tM = T,
mit Schrittweiten km = tm − tm−1 das Crank-Nicolson-Schema:
(um −um−1 , ψ) − 12 km (v m +v m−1 , ψ) = 0,
(v m −v m−1 , ϕ) + 12 km (c2 ∇(um +um−1 ), ∇ϕ) =0,
für alle Testfunktionen ϕ und ψ mit Anfangswerten u0 und v 0 . Bei diesem Zeitschrittverfahren
bleibt die totale Energie in jedem einzelnen Zeitschritt erhalten. Dazu setzen wir im variationellen
Schema ϕ := um − um−1 und ψ := v m − v m−1 und kombinieren die beiden resultierenden
Gleichungen zu
m 2
1
2 kv k
+ 12 kc∇um k2 =
m−1 2
1
k
2 kv
+ 12 kc∇um−1 k2 .
(6.2.27)
Die einzelnen Probleme in jedem Zeitschritt tm−1 → tm werden nun mit Hilfe eines FEVerfahrens diskretisiert. Dazu werden zu jedem Zeitlevel tm FE-Ansatzräume Vhm ⊂ V =
6.2 Finite-Elemente-Verfahren für hyperbolische Probleme
229
H01 (Ω) auf Gittern Tm
H der üblichen Art gewählt. Im folgenden betrachten wir zunächst den Fall,
daß die Gitter und Ansatzräume zu allen Zeitpunkten dieselben sind. Die allgemeine Situation
von mit der Zeit variierenden Ortsgittern ist in Abb. 6.1 skizziert.
Abbildung 6.1: Raum-Zeit-Gitter mit “hängenden Knoten“
Zu dem FE-Ansatz gehören wieder die Masse- und Steifigkeitsmatrizen
(i)
(i) (j)
Mh = (mij )ij = (ϕh , ϕh ) ij ,
(i) (j)
Ah = (aij )ij = (c2 ∇ϕh , ∇ϕh ) ij ,
wobei {ϕh , i = 1, ..., N } die Knotenbasis von Vh ist. Dabei wird angenommen, daß beide
Unbekannte uh sowie vh in demselben Ansatzraum Vh bestimmt werden. Dies ist wegen der
physikalisch vorgegebenen Randbedingung v|∂Ω = ∂t u|∂Ω = 0 sinnvoll. Eigentlich bräuchte vh
im Hinblick auf die gewählte variationelle Formulierung aber nur in L2 (Ω) gewählt zu werden.
m
m
Bezeichnen wir nun die zugehörigen Knotenwertvektoren von um
h und vh ebenfalls mit uh
m
und vh , so erhält das Zeitschrittschema die Gestalt
Mh (Uhm − Uhm−1 ) + 12 km Mh (Vhm − Vhm−1 ) = 0,
Mh (Vhm − Vhm−1 ) + 12 km Ah (Uhm + Uhm−1 ) = 0.
Dies kann nun so umgeformt werden, daß ein System von zwei sukzessive lösbaren Problemen
entsteht:
2
2
(Mh + 14 km
Ah )Uhm = Mh Uhm−1 + km Mh Vhm−1 − 41 km
Ah Uhm−1 ,
Mh Vhm = Mh Vhm−1 − 21 km Ah (Uhm + Uhm−1 ).
In jedem Zeitschritt sind also eine (modifizierte) Ritz-Projektion sowie eine L2 -Projektion durchzuführen. Die Konvergenzanalyse dieses Verfahrens kann wieder mit Hilfe der oben schon beschriebenen Energie-Technik“ erfolgen, was hier aber nicht ausgeführt werden soll.
”
230
Bei der Anwendung unbedingt stabiler, impliziter Differenzenschemata müssen in jedem Zeitschritt lineare Gleichungssysteme mit Koeffizientenmatrizen der Form Ih +αk2 Ah gelöst werden.
Deren Kondition verhält sich im Falle k ∼ h wie
κ2 (Ah ) ∼ 1.
(6.3.28)
Auf solchen gleichförmigen Gittern sind implizite Verfahren also verhältnismäßig kostengünstig.
Dies ändert sich aber, wenn das Ortsgitter zur Anpassung an irreguläre Lösungsstrukturen lokal
verfeinert wird.
6.4 Übungen
6.4 Übungen
Übung 6.1:
Übung 6.2:
231
232
Index
5-Punkte-Operator, 48, 57, 64, 83
7-Punkte-Operator, 50
9-Punkte-Operator
gestreckter, 48
kompakter, 48, 84
2
L -Norm-Fehler, 130
L2 -Norm-Fehlerschätzer, 135
L2 -Projektion, 107, 148, 227
L∞ -Norm-Fehler, 109, 130
M -Matrix, 83
V -elliptisch, 72
dG(0)-Verfahren, 208
dG(r)-Verfahren, 207
h/p-Finite-Elemente-Methode, 77
A-orthogonal, 157
A-Stabilität, 190
starke, 190, 196
strenge, 190
Abhängigkeitsbereich, 39, 225
Ableitung
schwache, 24
verallgemeinerte, 24
Abschneidefehler, 46, 186, 217, 223
Abstiegsrichtung, 156
Abstiegsverfahren, 156
Adaptionsstrategie, 141
ADI-Verfahren, 63, 216, 217
Adini (????-????), 93
Adini-Plattenelement, 93
Allgemeiner Störungssatz, 118
Anfangs-Randwert-Aufgabe, 32
Approximationseigenschaft, 173
Argyris (1916-2004), 92
Argyris-Plattenelement, 92
Assemblierung, 117
Aubin (????-????), 80
Aubin-Nitsche-Trick, 80
Banach (1892-1945), 2
Bandmatrix, 52, 60
Baryzentrische Koordinaten, 122
BDF-Verfahren, 185, 186
Bestapproximationseigenschaft, 74, 107
Bestimmtheitsbereich, 39
Biharmonischer Operator, 7, 21, 91, 120, 151
Bramble (1932-), 100
Bramble-Hilbert-Lemma, 100, 124, 210
Cauchy (1789-1857), 11
Cauchy-Problem, 11, 223
CFL-Bedingung, 220, 221
CG-Verfahren, 157, 160, 179, 215
quadriertes, 163
Charakteristik, 12
Charakteristisches Polynom, 223
Cholesky (1975-1918), 63
Cholesky-Zerlegung, 63, 215
Courant (1888-1972), 220
Crank (1916-), 185
Crank-Nicolson-Verfahren, 186, 190, 200, 207,
213, 215, 216, 226
gedämpftes, 198
Sehnentrapezform, 213
Tangententrapezform, 213
Dämpfung, 172
Defekt, 155
Defektgleichung, 169
Defektkorrektur-Iteration, 61
Diagonaldominanz
erweiterte , 52
irreduzible, 53
Differentialgleichung
2. Ordnung, 10
gewöhnliche, 10
lineare, 9
nichtlineare, 9, 15
Differentialoperator
elliptischer, 12
hyperbolischer, 12
parabolischer, 12
Differenzenappoximation, 45
Differenzengleichung, 223
Differenzenoperatoren, 45
Differenzenverfahren
A(0)-stabil, 185
explizit, 182
implizit, 182
Diffusions-Transport-Gleichung, 72
Dirac (1902-1984), 111
Dirac-Funktion, 111
Direkte Methode, 18
Dirichlet (1805-1859), 15
Divergenz, 1
Du Fort (????-????), 195
Du Fort-Frankel-Verfahren, 195
Duale Lösung, 132
Duales Problem, 132
233
234
Dualitätsargument, 80, 208
Eckensingularität, 23, 43, 146
Effektivitätsindex, 133, 139
Eigenwerte, 68
Eigenwertproblem, 31
Einschrittverfahren, 182
Element-(Last)-Vektor, 117
Element-(Steifigkeits)-Matrix, 117
Energie, 39
Energie-Form, 167, 181
Energie-Methode, 36, 199
Energie-Norm, 18, 74, 155
Energieerhaltung, 219
Energiefunktional, 71
Energienorm-Fehler, 80, 130
Energienorm-Fehlerschätzer, 134
Erhaltungsgleichung, 40
Euklid (ca. 355-290 v. Chr.), 1
Euklidische Vektornorm, 1
Euklidisches Produkt, 1
Euler (1707-1783), 183
Explizites Euler-Verfahren, 185, 192
F-Zyklus, 171, 215
Fehler
lokaler, 114
Fehlerbalancierungs-Strategie, 141
Fehlerfunktional, 131
Fehlerindikator, 140
Fest-Raten-Strategie, 142
Finite Elemente, 77
bi-kubisch, 93, 94
bi-linear, 92
bi-quadratisch, 92
isoparametrisch, 96
konform, 89
konstant, 89
kubisch, 91, 150
linear, 78, 89, 93
nicht-konform, 89
parametrisch, 96
quadratisch, 90, 93
quartisch, 91
quintisch, 92
tri-linear, 94
tri-quadratisch, 94
Finite-Elemente-Interpolierende, 89
Finite-Elemente-Raum, 207
INDEX
Fixpunktiteration, 62
Formfunktion, 77
Formregularität, 78
Fourier (1768-1830), 31
Fourier-Entwicklung, 31
Frankel (????-????), 195
Friedrichs (1901-1982), 220
Galerkin (1871-1945), 75
Galerkin-Gleichungen, 158
Galerkin-Orthogonalität, 208
Galerkin-Verfahren, 75
Gauß-Seidel-Verfahren, 63
Gaußsches Eliminationsverfahren, 61
Gauß (1777-1855), 2
Geschachteltes Mehrgitterverfahren, 171
Gitterfeinheit, 45
Gitternumerierung
diagonale, 60
Schachbrett, 61
zeilenweise, 60
Gitteroptimierung, 142
Gittersteuerung, 139
Gittertransfer, 171
Glätter, 171
Glättungseigenschaft, 36, 173, 190, 196, 198,
213
Glättungsiteration, 167
Größenregularität, 78
Gradient, 1
Gradientenverfahren, 157
Gram (1850-1916), 158
Gram-Schmidt-Algorithmus, 158
Green (1793-1841), 2
Greensche Funktion, 17, 111, 112
Greensche Identität, 56
Grobgitteroperatoren, 171
Grobgitterproblem, 168
Hängender Knoten, 227
Hölder (1859-1937), 2
Höldersche Ungleichung, 2, 27
Hadamard (1865-1963), 9
Halbbandbreite, 52
Halbgruppen-Methode, 36
Hauptteil, 12, 13
Hermite (1822-1901), 88
Hermite-Element, 88
Hestenes (1906-1991), 157
INDEX
Hilbert (1862-1943), 2
Hilbert (????-), 100
ILU-Verfahren, 63
Implizites Euler-Verfahren, 185, 186, 202, 207
Integralformel von Green, 2
Integralsatz von Gauß, 2
Interpolationsabschätzung, 101, 103
Interpolationskonstante, 208, 210
Interpolierende, 79
Inverse Beziehung, 105
Inverse Monotonie, 54, 193
inverse Monotonie, 68
Iterationsmatrix, 62
Jacobi (1804-1851), 62
Jacobi-Verfahren, 62
Jordan (1838-1922), 11
Kantenresiduum, 132
Kegelschnitt, 12
klassische Lösung, 32
Knoten, 78
Knotenbasis, 79
Knotenbasisfunktion, 79
Knotenfunktional, 88
Knotenwert, 78, 88
Koerzitivität, 72
Konditionierung, 118, 151
Konditionszahl, 68
Konformität, 89
Konsistenz, 46, 186
Konsistenzordnung, 46
Kontinuitätsgleichung, 5
Konvergenz, 57
Konvergenzordnung, 46, 67
Konvergenzrate, 62
Koordinatenrelaxation, 157
Kovalevskaya (1850-1891), 15
Kronecker (1823-1891), 56
Kronecker-Symbol, 56
Krylov (1879-1955), 155
Krylow-Raum, 158
Krylow-Raum-Methode, 155
Kutta (1867-1944), 207
Lösung
klassische, 16
schwache, 19, 43
235
Lösungskomplexität, 214
Lagrange (1736-1813), 79
Lagrange-Basis, 79
Lagrange-Element, 88
Lagrange-Hermite-Interpolation, 103
Lagrange-Interpolation, 79
Laplace (1749-1827), 1
Laplace-Operator, 1, 13, 30, 43, 48, 59, 155
Lastvektor, 116, 201
Lax (????-), 73
Lax-Milgram-Lemma, 73
Lebesgue (1875-1941), 23
Lebesgue-Raum, 26
Legendre (1752-1833), 158
Legendre-Polynom, 158
Lewy (????-????), 220
Line Search, 156
Linienmethode, 181, 185
M-Matrix, 54, 68, 193, 206
Mass-Lumping, 206
Massematrix, 116, 182, 201, 227
Matrix
diagonal-dominant, 83
von nicht-negativem Typ, 52, 83
Matrizennorm, 1
Maximumnorm, 2
Maximumprinzip, 20, 112
diskretes, 53
elliptisches, 20
für finite Elemente, 83
parabolisches, 34
Maximumprinzipmethode, 192
Mehrgitter-Zyklus, 168
Mehrgitterverfahren, 166, 215
Mehrstellenformel, 67
Milgram (????-????), 73
Minimalfolge, 18
Mittelpunktregel, 123
Mittelpunkts-Verfahren, 185
Monombasis, 77
Morley (????-????), 90
Morley-Plattenelement, 90
Multiindex, 98
Nabla-Operator, 1
Nachglättung, 169
Navier (1785-1836), 5
Navier-Stokes-Gleichungen, 5
236
Neumann, von (1903-1957), 16
Nicolson (1917-1968), 185
Nitsche (1926-1996), 80
Normaleneinheitsvektor, 1
Numerische Dissipativität, 190
Numerische Integration, 121, 125, 151
Operator
kompakt, 31
positiv-definit, 31
symmetrisch, 31
Orthonormalsystem, 173
Orts-Zeit-Diskretisierung, 184
Padé (1785-1836), 189
Padé-Schema, 189
Padé-Tafel, 189
Parallelogrammidentität, 18
Parseval (1755-1836), 37
Parsevalsche Identität, 37
Partielle Ableitung, 1
PCG-Verfahren, 163
Petrow (1912-1987), 75
Petrow-Galerkin-Verfahren, 75, 207
Plattengleichung, 7
Poincaré (1854-1912), 3
Poincarésche Ungleichung, 3, 27, 42, 43, 100
Poisson (1781-1840), 4
Poisson-Gleichung, 4, 7, 13, 15, 71, 109
Pollution-Effekt, 146
Polygonzugmethode, 183
Projektionsmethode, 74
Prolongation, 168, 169
Punktfehler-Schätzer, 137
Punktgitter, 45
Quadraturfehler, 124
Quadraturformel, 122
Rückwärtsdifferenzenformel, 185
Randbedingungen
Dirichletsche, 15, 32, 71
natürliche, 72
Neumannsche, 16, 32, 72
Robinsche, 16, 32, 72
Randwertaufgabe, 15, 42
Referenzelement, 94, 102, 117
Referenztransformation, 95
Rellichscher Auswahlsatz, 30
INDEX
Residuum, 132
Restriktion, 168, 169
Reynolds (1842-1912), 5
Richardson (1881-1953), 62
Richardson-Verfahren, 62, 166, 168, 180, 195
Riemann (1826-1866), 16
Riesz (1880-1956), 73
Rieszscher Darstellungssatz, 73
Ritz (1878-1909), 74
Ritz-Projektion, 108, 202, 227
Ritzsche Projektions-Verfahren, 74
Robin 1855-1897, 16
Rothe (1895-1988), 184
Rothe-Methode, 184, 201, 226
Runge (1856-1927), 207
Runge-Kutta-Verfahren, 207
Satz
Geschachteltes Mehrgitterverfahren, 178
Mehrgitterkomplexität, 177
Mehrgitterkonvergenz, 175
von Cauchy-Kovalevskaya, 15
von Lax-Milgram, 147
Schlitzgebiet, 23
Schmidt (1876-1959), 158
Schnelle Fourier-Transformation, 61
Schrittweitensteuerung, 206
Seidel, von (1821-1896), 63
Separabilität, 216
Shortley (1910-), 49
Shortley-Weller-Approximation, 49, 53, 58, 60,
67, 81
Simplex, 95
Simpson-Verfahren, 186
Sobolew (1908-1989), 19
Sobolew-Raum, 18, 24, 26, 71
Sobolewsche Ungleichung, 29, 44
Sobolow-Raum, 43
SOR-Verfahren, 63
Spektral-Elemente-Methode, 77
Spektral-Galerkin-Verfahren, 77
Spektral-Methode, 36, 195
Spektral-Theorie, 30
Spektralkondition, 160, 215
Spektralnorm, 194
Spektralverfahren, 77
Spezieller Störungssatz, 120
Splitting-Methode, 216
INDEX
Spur-Abschätzung, 28
Spur-Lemma, 28
Stabilität, 46
Startwert, 213
Steifigkeitsmatrix, 116, 182, 201, 227
Stiefel (1909-1978), 157
Stokes (1819-1903), 5
Strukturregularität, 78
Taylor (1685-1731), 10
Taylor-Reihe, 10
Teilschritt-θ-Verfahren, 191
Tensorprodukt-Basis, 77
Tensorprodukt-Gauß-Formel, 124
Tensorprodukt-Simpson-Regel, 124
Tensorprodukt-Trapezregel, 148
Tensorproduktformel, 123
Transfermatrix, 201
Trapezregel, 123
Triangulierung, 78
Tschebyscheff (1821-1894), 161
Tschebyscheff-Approximation, 161
Typeneinteilung, 10, 41
Unisolvenz, 88, 98, 149, 153
Unstetiges Galerkin-Verfahren, 207
V-Zyklus, 170
Variablenseparation, 33
Variationelle Formulierung, 72, 181, 226
Variationsgleichung, 6, 72, 74
Verfeinerungstrategie
Fehleräquilibrierung, 142
Verträglichkeit, 46
Vieta (1540-1603), 13
Vietascher Wurzelsatz, 13
Von Neumannsche Methode, 193
Von Neumannsche Stabilitätsanalyse, 195
Vorglättung, 169
Vorkonditionierung, 62, 163
ADI, 165
Diagonal, 164
ICCG, 164
SSOR, 164
W-Zyklus, 170
Wärmeleitungsgleichung, 4, 5, 14, 32, 181, 211
Wellengleichung, 4, 7, 14, 38, 219, 226
Weller (????-????), 49
237
Wilson (????-????), 93
Wilson-Plattenelelement, 93
Wohl-gestellt, 9, 15
Zeilensummenkriterium
schwaches, 53
Zeitschrittverfahren, 185
Zeitschrittweite, 182, 206, 219
Zelle, 77
Zellgewicht, 133
Zellresiduum, 132
Zusammenhang, 52
Zweigittermethode, 170
Zweigitteroperator, 172
Zweischrittformel, 219
Zweischrittverfahren, 182

Numerik Partieller Differentialgleichungen

Transcrição

Documentos relacionados

Sonstiges

Textaufgaben, die auf quadratische Gleichungen führen

Variationsansätze zur Bewegungsschätzung

Klausur zur Vorlesung Lineare Algebra I

Numerische Modellierung in der Geophysik Script zur

Ferienkurs der Experimentalphysik II Musterlösung¨Ubung 4

Lösung 8

Synthese von Kupfer(I)oxid

Musterlösung 14

Blatt 07