Zugexperimente an biologischen Molekülen
Transcrição
Zugexperimente an biologischen Molekülen
Zugexperimente an biologischen Molekülen: Modelluntersuchung und Simulation Pulling experiments on biological molecules: model analysis and simulation Masterarbeit zur Erlangung des akademischen Grades Master of Science Westfälische Wilhelms-Universität Münster Fachbereich Mathematik und Informatik Institut für Numerische und Angewandte Mathematik Eingereicht von: Katharina Wenzel Betreuung: Prof. Dr. Martin Burger Prof. Dr. Andreas Heuer Münster, Januar 2013 Eidesstattliche Erklärung Hiermit versichere ich, Katharina Wenzel, dass ich die vorliegende Arbeit selbstständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel verwendet habe. Gedanklich, inhaltlich oder wörtlich Übernommenes habe ich durch Angabe von Herkunft und Text oder Anmerkung belegt bzw. kenntlich gemacht. Dies gilt in gleicher Weise für Bilder, Tabellen, Zeichnungen und Skizzen, die nicht von mir selbst erstellt wurden. Alle auf der CD beigefügten Programme sind von mir selbst programmiert worden. Münster, 11. Januar 2013 Katharina Wenzel i Danksagung An dieser Stelle möchte ich mich bei all denen bedanken, ohne deren Unterstützung das Gelingen dieser Arbeit nicht möglich gewesen wäre. Mein erster Dank richtet sich an Prof. Martin Burger vom Institut für Numerische und Angewandte Mathematik und Prof. Andreas Heuer vom Institut für Physikalische Chemie, die diese Kollaboration erst ermöglicht haben. Weiter möchte ich mich bei Jens Smiatek für seine Betreuung und das Korrekturlesen dieser Arbeit bedanken. Nicht nur die vielen Hilfestellungen bei inhaltlichen und technischen Problemen in unzähligen E-mails und Telefonaten trugen maßgeblich zum Erfolg dieser Arbeit bei, auch die vielen Erläuterungen zu chemischen Phänomenen, von denen ich als Mathematikerin nicht viel Ahnung hatte, waren mir eine große Hilfe. Danke auch dem gesamten Arbeitskreis Heuer, der mich so freundlich aufgenommen und integriert hat. Besonderer Dank gilt dabei Carsten Schroer, Pritam Kumar Jana und Oleg Buller. Erste Hilfe bei Programmierproblemen, Verbesserung der fachspezifischen Englischkenntnisse und viele lustige Momente schufen eine tolle Atmosphäre um diese Arbeit zu schreiben. Mein persönlicher Dank gilt meinen Eltern, die mich während meiner Arbeit und des ganzen Studiums motiviert, unterstützt und aufgemuntert haben. Zuletzt möchte ich mich bei meinem Lebensgefährten Benedikt Ferling bedanken. Er konnte mich auch in schwierigen Phasen motivieren und aufmuntern und hat mich während der ganzen Zeit emotional begleitet. iii Inhaltsverzeichnis 1. Einleitung 1 2. Fokker-Planck Gleichung 2.1. Herleitung über die Mastergleichung . . . . . . 2.2. Brownsche Bewegung . . . . . . . . . . . . . . . 2.2.1. Ergebnisse der Langevin-Gleichung . . . 2.2.2. Einführung des Potentials . . . . . . . . 2.3. Zurück zu Fokker-Planck . . . . . . . . . . . . . 2.4. Eigenschaften der Lösung . . . . . . . . . . . . 2.4.1. Stationäre Lösung . . . . . . . . . . . . . 2.4.2. Konvergenz gegen die stationäre Lösung 2.4.3. Lösungsansatz über Eigenwerte . . . . . 3. Modellsystem 3.1. Beschreibung des Systems . . . . . . . . 3.1.1. Testen der Implementierung . . . 3.1.2. Doppelmuldenpotential . . . . . . 3.2. Zugexperimente in 2D . . . . . . . . . . 3.2.1. Potential in 2D . . . . . . . . . . 3.2.2. Erweiterung zum Zugexperiment 3.2.3. Analyse der Parameter . . . . . . 3.3. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 8 9 13 14 15 15 17 19 . . . . . . . . 21 21 22 24 25 26 27 28 28 v Inhaltsverzeichnis 4. Biomoleküle 4.1. Untersuchung mit AFM . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Untersuchung durch Simulationen . . . . . . . . . . . . . . . . . . . . . 4.3. Trp-cage Molekül TC5b . . . . . . . . . . . . . . . . . . . . . . . . . . 35 36 37 39 5. Zugexperimente 5.1. Experimentelle Vorgehensweise . . . . . 5.1.1. AFM in Zugexperimenten . . . . 5.1.2. Messziele und typische Ergebnisse 5.2. Zugexperimente durch MD Simulationen 5.2.1. Die Freie Energiedifferenz . . . . 5.2.2. GROMACS . . . . . . . . . . . . 5.3. Zugexperimente am TC5b . . . . . . . . 5.3.1. Vorbereitung . . . . . . . . . . . 5.3.2. Zug-Simulationen . . . . . . . . . 5.3.3. Ergebnisse . . . . . . . . . . . . . 5.3.4. Vergleiche mit dem Modell . . . . 5.4. Weitere Möglichkeiten . . . . . . . . . . 41 42 43 43 45 46 47 48 48 51 52 60 61 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Zusammenfassung und Ausblick 63 A. Ergänzende Abbildungen 65 B. C++-Programmübersicht 69 Abbildungsverzeichnis 71 Literaturverzeichnis 73 vi 1. Einleitung Biologische Moleküle spielen eine wichtige Rolle beim Verständnis der Prozesse in Organismen. Zu den Bedeutensten zählen die DNA, RNA und die Proteine. Sie bestimmen den Ablauf vieler Prozesse in unserem Körper und anderen lebenden Organismen und legen den genetischen Code fest. Doch ihre Eigenschaften und Funktionsweisen sind noch nicht vollständig erforscht. Im menschlichen Körper, in Tieren und Pflanzen existieren auch viele kleinere Biomoleküle, deren Bedeutung für biologische Systeme teilweise noch garnicht geklärt werden konnte. Zusätzlich ist die Anzahl an synthetisch herstellbaren Proteinen durch unterschiedliche Basenabfolgen riesig und nicht alleine deshalb expandiert dieses Forschungsgebiet immer weiter. Doch auch bei den meisten schon entdeckten Biomolekülen sind ihre Eigenschaften noch nicht ausreichend erforscht. Fragen von wissenschaftlichem Interesse betreffen die Struktur und deren Bedeutung, die diese im Zusammenspiel mit anderen Vorgängen besitzt. Auch Fragen nach Krankheiten und deren Behandlung sind eng verbunden mit Biomolekülen. So können durch mutierte, nicht-native Faltungen einiger Proteine Krankheiten wie Alzheimer und Parkinson entstehen [49, 54]. Auf welche Weise Biomoleküle verändert werden und welche Auswirkungen daraus entstehen ist noch nicht endgültig geklärt. Hier braucht es ein vertieftes Grundverständnis für Biomoleküle und ihre Interaktion mit ihrer Umgebumg um all diese Prozesse und ihre Implikationen besser verstehen zu können. Eine wichtige Eigenschaft von Biomolekülen ist ihre Möglichkeit der Faltung. Aus der gefalteten Konfiguration entfalten sich Biomoleküle unter gewissen Einflüssen und umgekehrt. Dabei hängt der native Zustand (Grundzustand) von der physiologischen Umgebung ab und kann sowohl im gefalteten, als auch im entfalteten Stadium liegen. Proteine und andere Biomoleküle können je nach Konfigurationsanordnung viele verschiedene Funktionen ausüben. Doch was beeinflusst dieses Falten und Entfalten? Welche Vorraussetzungen müssen erfüllt werden, damit diese Prozesse aktiviert werden und wie kann man sie systematisch beeinflussen? 1 1. Einleitung Biologische Moleküle bilden sehr komplexe Systeme. Eine besondere Herausforderung liegt in der großen Anzahl an Freiheitsgraden, welche detaillierte Untersuchungen erschweren. Durch sie können Biomoleküle viele Konfigurationen annehmen. Dabei liegt der native Zustand in einem energetischen Minimum. Doch der Weg zum nativen Zustand muss wegen der hohen Komplexität nicht eindeutig sein. Bei der Erforschung dieser Bedingungen bekommen Computersimulationen eine immer größere Bedeutung. Zwar ist der Simulationsaufwand noch immer sehr hoch, vor allem für sehr große und komplexe Biomoleküle, doch der Fortschritt schreitet schnell voran und viele Phänomene können mit ihrer Hilfe besser verstanden werden. Auch die Verbesserung der Methoden und Implementierungen machen diesen Forschungszweig zu einem immer wichtigeren Teil der Forschung. Diese Arbeit beschäftigt sich mit den gängigsten Methoden der Analyse und Modellierung des Entfaltungsvorganges. Ein Schwerpunkt wird dabei auf Computersimulationen an grundlegenden Beispielen gelegt. Die Arbeit ist wie folgt aufgebaut: Um einen Einblick in die mathematischen Grundlagen für Simulationen zu erhalten beschäftigt sich Kapitel 2 mit der Fokker-Planck Gleichung, welche die Grundlage für die Modellierung der Bewegung von Biomolekülen bildet. Zuerst wird eine allgemeine Herleitung über die Mastergleichung betrachtet. Anschließend wird die Fokker-Planck Gleichung vor dem Hintergrund Brownscher Dynamik erläutert. Danach wird in Kapitel 3 exemplarisch ein vereinfachtes Modell zur theoretischen Analyse von Zugexperimenten betrachtet. In Kapitel 4 wird anschließend eine Einführung in Biomoleküle gegeben und wichtige Methoden zur ihrer Analyse und Erforschung erläutert. Weiter wird eine Einführung in Computersimulationen gegeben und das Trp-cage Miniprotein TC5b vorgestellt, welches in späteren Kapiteln genauer betrachtet wird. Anschließend werden in Kapitel 5 allgemeine Zugexperimente vorgestellt. Danach wird das Augenmerk auf Zugexperimente in Simulationen gelegt, bevor MD-Simulationen am TC5b durchgeführt und ihre Ergebnisse diskutiert werden. Darauf folgt ein kleiner Ausblick auf weitere Analysemethoden durch Simulationen. Kapitel 6 gibt abschließend eine Zusammenfassung der Ergebnisse und einen Ausblick auf weitere Forschungsmöglichkeiten. 2 2. Fokker-Planck Gleichung Die mathematischen Konzepte hinter Zugexperimenten spielen für ihr Verständnis eine große Rolle. Diesbezüglich soll hier eine Einführung in die zugrunde liegende Bewegungsgleichung und ihre Bedeutung gegeben werden. Zunächst wird die allgemeine Fokker-Planck Gleichung betrachtet. Anschließend wird zur Spezialisierung von Systemen unter Brownscher Dynamik übergegangen. Dieses Kapitel dient als Grundlage für die in Kapitel 3 implementierten Systeme. Der Name Fokker-Planck geht auf die Arbeiten von Fokker (1914) [23] und Planck (1917) [61] zurück, die sich mit der Brownschen Bewegung von Teilchen beschäftigt haben. Alternativ für diese Gleichung wird auch der Begriff ‘Vorwärts Kolmogorov’ Gleichung verwendet, benannt nach Kolmogorov (1931) [36] (siehe [27, 65]). Grundlegend beschreibt die Gleichung den Fluss und die Diffusion eines Systems. Sie legt also die zeitliche Entwicklung fest. Allgemein beschreibt die Fokker-Planck Gleichung (FPG) die Wahrscheinlichkeit p(x, t), dass sich ein Teilchen zu gegebenem Zeitpunkt an einem bestimmten Ort befindet. Eine einfache Form ist ∂t p(x, t) = −∇ · [∇V (x)p(x, t)] + D∆p(x, t), (2.1) wobei V 0 (x) eine externe Kraft darstellt und D = const. der Diffusionskoeffizient ist. Aus der FPG können durch unterschiedliche Annahmen und Spezialisierungen viele bekannte Gleichungen erhalten werden. So kann zum Beispiel eine reine Diffusionsgleichung ∂t p(x, t) = D∆p(x, t) durch Vernachlässigung des ersten Teils entstehen. Mit konstantem Potential wird eine einfache Drift-Diffusionsgleichung ∂t p(x, t) = −V ∇p(x, t) + D∆p(x, t) erhalten. Mit veränderlichem Potential und der Betrachtung Brownscher Bewegung nennt man sie dann Kramers-Gleichung. Unter der Annahme großer Reibung kann daraus die Smoluchowski-Gleichung ∂t p(x, t) = c∇V (x)p(x, t) + D∆p(x, t) hergeleitet werden. Um einen tieferen Einblick in die FPG zu erhalten wird im folgenden Abschnitt zunächst eine allgemeine Herleitung diskutiert. Daran anschließend folgt die Untersuchung der Smoluchowski Gleichung. 3 2. Fokker-Planck Gleichung 2.1. Herleitung über die Mastergleichung Da die Fokker-Planck Gleichung sehr allgemein gehalten ist existieren viele Varianten der Herleitung. Um einen Einblick in die Grundkonzepte der Stochastik zu erhalten wird hier ein Ansatz über die Mastergleichung in einer Dimension erläutert. Die allgemeine Mastergleichung ist von der Form 1 ∂t p(x, t) = lim ∆t→0 ∆t Z ∞ [p(x0 , t)w(x0 , t|x, t + ∆t) − p(x, t)w(x, t|x0 , t + ∆t)]dx0 . (2.2) −∞ Dabei beschreibt p(x, t) die Wahrscheinlichkeitsdichte von x(t), also die Wahrscheinlichkeit im Ort x zum Zeitpunkt t zu sein. w(x, t|z, t+∆t) beschreibt die (zeitabhängige) Übergangsrate, dass z(t + ∆t) gilt mit z = x zum Zeitpunkt t. Die Mastergleichung für die Wahrscheinlichkeit zum Zeitpunkt t + ∆t im Ort x zu sein setzt sich aus folgenden Überlegungen zusammen: • die Wahrscheinlichkeit x(t) und keine Veränderung • plus die Wahrscheinlichkeit x0 (t) und ein Übergang zu x(t + ∆t) • minus die Wahrscheinlichkeit x(t) und ein Übergang zu x0 (t + ∆t) Dabei beschreibt x0 jeden beliebigen Ort mit x0 6= x. Die Wahrscheinlichkeit, dass sich ein Teilchen an einem bestimmten Ort aufhält multipliziert mit der Rate, von diesem Ort genau nach x zu springen gibt dann die Wahrscheinlichkeit für p(x, t). Betrachtet über alle Orte führt dies auf die kontinuierliche Gleichung Z ∞ p(x, t + ∆t) = p(x, t) − [p(x, t)w(x, t|x0 , t + ∆t)]dx0 −∞ Z ∞ [p(x0 , t)w(x0 , t|x, t + ∆t)]dx0 . + −∞ Durch Umformung, Teilen durch ∆t und Betrachtung ∆t → 0 erhält man daraus Gleichung (2.2), denn: lim ∆t→0 p(x, t + ∆t) − p(x, t) = ∂t p(x, t). ∆t Um der Lesbarkeit beizusteuern wird in den folgenden Schritten die Zeitabhängigkeit der Übergangsraten nicht mehr explizit hingeschrieben. Daraus folgt die Schreibweise w(y|z) = w(y, t|z, t + ∆t). 4 2.1. Herleitung über die Mastergleichung Aufbauend auf der Mastergleichung (2.2) wollen wir hieraus durch bestimmte Annahmen die Fokker-Planck Gleichung herleiten. Dazu wird der Abstand ∆x = x0 − x betrachtet und in die Gleichung eingesetzt. Wir erhalten somit Z ∞ 1 [p(x0 , t)w(x0 |x) − p(x, t)w(x|x0 )]dx0 ∂t p(x, t) = lim ∆t→0 ∆t −∞ Z ∞ 1 = lim [p(x + ∆x, t)w(x + ∆x|x) − p(x, t)w(x|x + ∆x)]dx0 ∆t→0 ∆t −∞ Z ∞ 1 = lim [p(x − ∆x, t)w(x − ∆x|x) − p(x, t)w(x|x + ∆x)]dx0 . ∆t→0 ∆t −∞ Im letzten Schritt wurde ausgenutzt, dass bei der Integration über alle x0 der Übergang ∆x → −∆x gültig ist. In den kommenden Rechnungen wird analog zu Reichl [63] die Übergangsrate umgeschrieben als τ (x, ∆x) = w(x|x + ∆x). Hier sollte beachtet werden, dass auch τ analog zu w zeitabhängig ist, aber auch dies der Lesbarkeit wegen weggelassen wurde. Durch Umformung erhält man daraus τ (x − ∆x, ∆x) = w(x − ∆x|x). Einsetzen in die obige Gleichung ergibt dann 1 ∂t p(x, t) = lim ∆t→0 ∆t Z ∞ [p(x − ∆x, t)τ (x − ∆x, ∆x) − p(x, t)τ (x, ∆x)]dx0 . −∞ Eine Taylorentwicklung in p(x − ∆x, t)τ (x − ∆x, ∆x) um −∆x unter der Annahme kleiner Sprünge ergibt ∞ X (−∆x)n ∂ n (p(x, t)τ (x, ∆x)). p(x − ∆x, t)τ (x − ∆x, ∆x) = n! ∂xn n=0 Einsetzen führt auf folgende Gleichung: 1 ∆t Z 1 = lim ∆t→0 ∆t Z ∂t p(x, t) = lim ∆t→0 ∞ −∞ " # ∞ n n X (−∆x) ∂ (p(x, t)τ (x, ∆x)) − p(x, t)τ (x, ∆x) dx0 n n! ∂x n=0 ∞ X (−∆x)n ∂ n (p(x, t)τ (x, ∆x))dx0 n n! ∂x −∞ n=1 ∞ ∞ X (−1)n ∂ n = (p(x, t)αn (x)). n! ∂xn n=1 Als endgültige Gleichungen erhalten wir ∞ X (−1)n ∂ n ∂t p(x, t) = (p(x, t)αn (x)), n! ∂xn n=1 (2.3) 5 2. Fokker-Planck Gleichung mit αn (x) als dem n-ten Moment Z ∞ 1 αn (x) = lim (∆x)n τ (x, ∆x)dx0 ∆t→0 ∆t −∞ Z ∞ 1 = lim (∆x)n w(x, t|x + ∆x, t + ∆t)dx0 . ∆t→0 ∆t −∞ (2.4) Gleichung (2.3) heißt die Kramers-Moyal Entwicklung der Mastergleichung. Lemma 2.1 (Pawula Theorem): Existieren die αn wie in (2.4) für alle n N mit αn < ∞ und sei αn = 0 für einige gerade n, dann gilt αn = 0 für alle n ≥ 3. Beweis: analog zu [58, 59]: Gegeben für alle n N gilt Z ∞ 1 (∆x)n w(x, t|x + ∆x, t + ∆t)dx0 αn (x) = lim ∆t→0 ∆t −∞ Z ∞ 1 (∆x)(n−1)/2 (∆x)(n+1)/2 w(x, t|x + ∆x, t + ∆t)dx0 . = lim ∆t→0 ∆t −∞ Unter der Annahme ungerader n mit n ≥ 3 und Anwendung der Cauchy-Schwarz Ungleichung folgt damit Z ∞ 1 αn2 (x) ≤ lim ( (∆x)(n−1) w(x, t|x + ∆x, t + ∆t)dx0 ) ∆t→0 ∆t −∞ Z ∞ 1 ·( (∆x)(n+1) w(x, t|x + ∆x, t + ∆t)dx0 ). ∆t −∞ Analog für gerade n mit n ≥ 4 folgt Z ∞ 1 αn2 (x) ≤ lim ( (∆x)(n−2) w(x, t|x + ∆x, t + ∆t)dx0 ) ∆t→0 ∆t −∞ Z ∞ 1 ·( (∆x)(n+2) w(x, t|x + ∆x, t + ∆t)dx0 ). ∆t −∞ Insgesamt ergibt das die folgenden zwei Gleichungen: 6 αn2 (x) ≤ αn−1 (x) · αn+1 (x) (2.5a) αn2 (x) ≤ αn−2 (x) · αn+2 (x). (2.5b) 2.1. Herleitung über die Mastergleichung Sei nun r N mit αr = 0 und r gerade. Einsetzen von n = r − 1 bzw. n = r + 1 in (2.5a) und n = r − 2 bzw. n = r + 2 in (2.5b) ergibt die vier Gleichungen α(r−2)2 ≤ αr−4 αr , r≥6 (2.6a) α(r−1)2 ≤ αr−2 αr , r≥4 (2.6b) α(r+1)2 ≤ αr αr+2 , r≥2 (2.6c) α(r+2)2 ≤ αr αr+4 , r ≥ 2. (2.6d) Da nach Voraussetzung αn < ∞ für alle n N gilt, folgt aus den Gleichungen (2.6), dass αr−2 , αr−1 , αr+1 und αr+2 wegen αr = 0 gleich Null sind. Durch wiederholte Anwendung dieses Arguments folgt daraus αn = 0 für alle n ≥ r. Nach unten ist dies beschränkt durch Gleichung (2.6b) bzw. (2.6c), denn die Wahl für r, so dass αn = 0, ergibt als kleinsten Nullwert n = 3. Daraus folgt die Behauptung. Aus dem Pawula-Theorem folgt, dass die Kramers-Moyal Entwicklung entweder aus unendlich vielen Termen besteht oder (spätestens) nach dem zweiten Term abbricht. Existiert also ein beliebiges gerades Moment αn = 0 folgt daraus die allgemeine FokkerPlanck Gleichung: ∂t p(x, t) = − 1 ∂2 ∂ (p(x, t)α1 (x)) + (p(x, t)α2 (x)). ∂x 2 ∂x2 (2.7) Eine geeignete Wahl für αn (x) bzw. w(x, t|x+∆x, t+∆t) führt dann auf die vereinfachte Form der Fokker-Planck Gleichung (2.1). Beispiele dafür sind in [14] und [63] gegeben. Analog zu obigem Vorgehen kann man die Fokker-Planck Gleichung im Mehrdimensionalen herleiten. Hier sei darauf aufmerksam gemacht, dass das Pawula-Theorem auch für mehrdimensionale Entwicklungen gilt. Der Beweis ist in [59] gegeben und basiert darauf, dass die Vorraussetzungen von Lemma 2.1 für jede Richtung erfüllt werden. Daraus kann die mehrdimensionale Fokker-Planck Gleichung in der Form d 1 p(x, t) = −∇ (p(x, t)α1 (x)) + ∆ (p(x, t)α2 (x)) dt 2 erhalten werden. 7 2. Fokker-Planck Gleichung 2.2. Brownsche Bewegung Die Bewegung von Teilchen in Flüssigkeiten wurde zuerst 1827 von Robert Brown untersucht. Er entdeckte, dass sich Pollen in Wasser auf irregulare Weise bewegten. Eine weitere systematische Analyse seinerseits zeigte, dass diese Bewegungsform charakteristisch für alle kleinen Teilchen in Flüssigkeit ist. Erst 80 Jahre später brachten Einstein [20] und Smoluchowski [78] unabhängig voneinander die erste mathematische Erklärung für diese Bewegung. Die Lösungsmittelmoleküle kollidieren mit den Teilchen und durch Impulsübertrag als auch durch die vorhandene Reibung wird die scheinbar irreguläre Bewegung der Teilchen hervorrufen. Im Folgenden wollen wir uns mit den Gleichungen beschäftigen die ein solches System beschreiben. Der Anschaulichkeit wegen soll weiterhin der eindimensionale Fall betrachtet werden. Wie schon erwähnt ist eine Erweiterung auf höhere Dimensionen analog herzuleiten. Zusätzlich werden zur Vereinfachung Teilchen mit Punktmasse betrachtet. Brownsche Bewegung beschreibt die zufällige Bewegung in eine beliebige Richtung und die Abbremsung durch Reibung. Allgemein müssen Teilchen der Newtonschen Bewegungsgleichung gehorchen, also F = m·a, Kraft ist gleich Masse mal Beschleunigung. Hierbei setzt sich die Kraft auf die Teilchen aus einem Reibungs- und einem Zufallsterm zusammen. Umgestellt und die Definition der Beschleunigung als zweite Ableitung des Ortes eingesetzt ergeben sich daraus die Gleichungen: F d2 x = = F = F R + Z(t) 2 dt m dx R F = −ζ = −ζv Stokes0 sche Reibung dt d2 dx ⇒ 2 x(t) = −ζ + Z(t). dt dt Eingesetzt wurde die Stokes’sche Reibung mit Reibungskoeffizient ζ = γ/m, der hier schon mit der Masse skaliert wurde. Hier ist Z(t) = Z(t)/m die Beschleunigung des Teilchens x. Im Mittel muss diese zufällige Beschleunigung verschwinden, also hZ(t)i = 0 erfüllen. Zusätzlich sollte sie unkorreliert sein durch hZ(t), Z(t0 )i = C·δ(t−t0 ). Die Konstante C = hz 2 (t)i muss das Fluktuations-Dissipations Theorem erfüllen. Umgeschrieben bezüglich der Geschwindigkeit und des Ortes werden die Langevin-Gleichungen 8 2.2. Brownsche Bewegung erhalten ∂t x(t) = v(t) (2.8a) ∂t v(t) = −ζv(t) + Z(t) (2.8b) hZ(t)Z(t0 )i = Cδ(t − t0 ). (2.8c) 2.2.1. Ergebnisse der Langevin-Gleichung Einige bedeutsame Eigenschaften können aus der Langevin-Gleichung gewonnen werden, denn durch sie ist eine genaue Beschreibung von Faktoren wie dem Diffusionskoeffizient möglich. Der Ansatz für die folgenden Rechnungen ist [27, 57, 65] entnommen. Erwartungswerte P Der Erwartungswert über die Geschwindigkeiten aller Teilchen, mit hvi = 1/N N i vi ergibt durch Lösen der gewöhnlichen Differenzialgleichung mit Anfangswert v(0) = v0 d v(t) = −ζv(t) + Z(t) dt Z t ⇒ v(t) = v0 e−ζt + Z(τ )e−ζ(t−τ ) dτ 0 ⇒ hv(t)i = hv0 ie −ζt ⇒ lim hv(t)i = 0. t→∞ Im thermodynamischen Gleichgewicht sind die Geschwindigkeiten im Mittel also Null. Analog kann so auch der Erwartungswert des Orts durch Einsetzen von v(t) = dtd x(t) 9 2. Fokker-Planck Gleichung in Abhängigkeit von v0 mit x(0) = 0 errechnet werden als Z t d −ζt Z(τ )e−ζ(t−τ ) dτ x(t) = v(t) = v0 e + dt 0 Z t Z t0 Z t −ζt0 0 −ζt0 0 e dt + e dt Z(τ )eζτ dτ ⇒ x(t) = v0 0 0 0 Z t0 Z t v0 0 = Z(τ )eζτ dτ e−ζt dt0 1 − e−ζ + ζ 0 0 hv0 i ⇒ hx(t)i = 1 − e−ζt ζ hv0 i ⇒ lim hx(t)i = . t→∞ ζ Varianz der Geschwindigkeit Allgemein berechnet sich die Varianz durch σv2 = hv 2 i − hvi2 . Im thermodynamischen Gleichgewicht reduziert sich die Varianz auf σv2 = hv 2 i (siehe oben). Nach dem Gleichverteilungssatz der Energie gilt hEkin i = 21 kB T pro Freiheitsgrad. Standardgemäß ist hier kB die Boltzmannkonstante und T die Temperatur. Für die kinetische Energie gilt allgmein hEkin i = 21 mhv 2 i. Dadurch ist die Varianz der Geschwindigkeit im eindimensionalen Fall für das thermodynamischen Gleichgewicht gegeben als hv 2 (t)i = kBmT . Im Fall höherer Dimensionen muss der Wert durch weitere Freiheitsgrade pro Dimension erhöht werden auf hv 2 (t)i = D kBmT . Hier werden die Teilchen als Kugeln approximert. Im Falle einer anderen Betrachtung müssen eventuell noch zusätzliche Rotationsfreiheitsgrade berücksichtigt werden, was wiederum zu einem größeren Wert führt. 10 2.2. Brownsche Bewegung Varianz des Zufallsterms Aus der Rechnung für hv 2 (t)i kann man auf die Varianz der Zufallszahl schließen. Für die Lösung der Langevin-Gleichung (2.8b) gilt Z t Z(τ )e−ζ(t−τ ) dτ + v0 e−ζt Z t Z0 t 0 −ζ(t−τ ) 2 Z(τ 0 )e−ζ(t−τ ) dτ 0 i + hv0 i2 e−2ζt dτ ⇒ hv (t)i = h Z(τ )e 0 Z 0t Z t 0 e−2ζt+ζ(τ +τ ) hZ(τ )Z(τ 0 )idτ 0 dτ + hv0 i2 e−2ζt = 0 0 Z tZ t 0 −2ζt eζ(τ +τ ) δ(τ − τ 0 )dτ 0 dτ + hv0 i2 e−2ζt = Ce Z0 t 0 e2ζτ dτ + hv0 i2 e−2ζt = Ce−2ζt v(t) = 0 C = (1 − e−2ζt ) + hv0 i2 e−2ζt . 2ζ Im thermodynamischen Gleichgewicht erhält man somit lim hv 2 (t)i = t→∞ C 2 −2ζt (1 − e|−2ζt {z }) + hv0 i e| {z } 2ζ →0 →0 C = . 2ζ Nach dem Gleichverteilungssatz der Energie gilt nach oben hv 2 (t)i = kB T . m Daraus folgt C ! kB T = 2ζ m 2ζ ⇔ C = hz 2 (t)i = kB T. m hv 2 (t)i = Für die Varianz der Zufallskraft ergibt sich somit hZ(t)Z(t0 )i = (2.9) 2ζ k T δ(t m B − t0 ). 11 2. Fokker-Planck Gleichung Varianz der Ortskoordinaten Ebenso kann die Varianz im Ort unter der Vorraussetzung x(0) = 0 errechnet werden. Z t0 Z t v0 −ζt0 0 −ζt Z(τ )eζτ dτ e dt x(t) = 1−e + ζ 0 0 Z t Z t0 Z t00 Z t 2 hv0 i 0 2 −ζt0 0 −ζt00 00 ζτ −ζt 2 ⇒ hx (t)i = 2 1 − e e dt e dτ eζτ hZ(τ )Z(τ 0 )i dτ 0 + e dt | {z } ζ 0 0 0 | {z } 0 =Cδ(τ −τ 0 ) C̃ Z = C̃ + = C̃ + = C̃ + = C̃ + = C̃ + −ζt0 Z t −ζt00 Z min(t0 ,t00 ) 000 e2ζτ dτ 000 e dt e dt 0 0 Z0 Z i C t t −ζ(t0 +t00 ) h 2ζmin(t0 ,t00 ) e e − 1 dt00 dt0 2ζ 0 0 Z Z C t t −ζ|t0 −t00 | 0 00 e − e−ζ(t +t ) dt00 dt0 2ζ 0 0 Z Z Z 0 Z C t t −ζ(t0 −t00 ) 00 0 C t −ζt0 0 t −ζt00 00 e dt e dt dt − e dt ζ 0 0 2ζ 0 0 Z C t C −ζt0 1 − e dt0 − 3 e−ζt − 1 e−ζt − 1 2 ζ 0 2ζ C C −ζt C −2ζt −ζt t + e − 1 − e − 2e + 1 ζ2 ζ3 2ζ 3 C C −ζt −2ζt t − 3 − 4e + e ζ2 2ζ 3 = C̃ + C = C̃ + t Einsetzen von C = 2ζ k T m B hx2 (t)i = 0 00 ergibt die Gleichung 2 hv0 i2 kB T kB T 1 − e−ζt + 2 t− 2 3 − 4e−ζt + e−2ζt 2 ζ ζm ζ m Im thermodynamischen Gleichgewicht folgt daraus lim hx2 (t)i = t→∞ hv0 i2 kB T kB T +2 t−3 2 2 ζ ζm ζ m ⇒ lim hx2 (t)i ∝ 2Dt t→∞ mit D = kB T . ζm Diese Relation wurde von Einstein veröffentlicht. D gibt somit ein Maß für die Größe der Ausbreitung in Abhängigkeit des Reibungskoeffizienten ζ an. Hier werden stochastische Größen betrachtet und dadurch auch stochastische Integration durchgeführt. Für ein besseres Verständnis und eine genauere Betrachtung sei auf die Arbeiten von 12 2.2. Brownsche Bewegung Itô [30] hingewiesen, oder den entsprechenden Kapiteln in [27, 57, 65]. 2.2.2. Einführung des Potentials Dem Verhalten von biologischen Molekülen liegt eine potentielle Energielandschaft zugrunde. Dieses Potential ist unabhängig von der Brownschen Bewegung und verändert den Fluss der Teilchen in soweit, dass gewisse Zustände durch lokale und globale Minima bevorzugt werden. Die Langevin-Gleichungen schreiben sich dann als d x(t) = v(t) dt d v(t) = −ζv(t) − V 0 (x(t)) + Z(t) dt 2ζ hZ(t)Z(t0 )i = kB T δ(t − t0 ). m (2.10a) (2.10b) (2.10c) mit V 0 (x) = m1 ∂x V (x) und V (x) dem zugrunde liegenden Potential. Die letzte Gleichung wurde aus den Rechnungen in Abschnitt 2.2.1 erhalten. Durch die Einführung des Potentials besteht zusätzlich zur diffusiven Zufallskraft ein Driftterm. Fall hoher Reibung Unter der Annahme hoher Reibung durch die Wahl eines großen ζ wird der Fall schnell relaxierender Geschwindigkeiten betrachtet. Die Idee besteht darin, dass die Teilchen nach der Anregung schnell wieder in einen stationären Zustand übergehen. Dadurch kann die Approximation (dv(t)/dt) ≈ 0 gemacht werden und für die Langevingleichungen (2.10) folgt d −1 0 1 x(t) = V (x) + Z(t) dt ζ ζ 2ζ hZ(t)Z(t0 )i = kB T δ(t − t0 ). m (2.11a) (2.11b) 13 2. Fokker-Planck Gleichung 2.3. Zurück zu Fokker-Planck Die Fokker-Planck Gleichung bezieht sich auf die Aufenthaltswahrscheinlichkeiten von Teilchen. Um die Langevin-Gleichung als Fokker-Planck Gleichung zu schreiben betrachten wir die Brownsche Bewegung in einem beschränkten Gebiet Ω. Dabei ist Ω ein Gebiet über Ort und Geschwindigkeit. Über den gesamten Raum betrachtet muss für die Aufenthaltswahrscheinlichkeit gelten Z ∞ Z ∞ ρ(x, v, t)dvdx = 1. −∞ −∞ Die Wahrscheinlichkeitsänderung für den Aufenthalt im Gebiet Ω wird, durch das Fehlen von Quellen und Senken, alleine durch den Fluss über die Gebietsgrenzen beschrieben. Die Flussgeschwindigkeit im Punkt (x, v) wird dabei analog zu [63] mit Ẋ = (ẋ, v̇) bezeichnet. Z Z d ρ(x, v, t)dvdx = − ρ(x, v, t)Ẋdσ. dt Ω ∂ΩZ Gauss = − ∇ · (Ẋρ(x, v, t))dvdx Ω Ω ist ein beschränktes Gebiet und die Ableitung kann mit dem Integral vertauscht werden. Da es sich um ein beliebiges beschränktes Gebiet handelt folgt ∂(ẋρ(x, v, t)) ∂(v̇ρ(x, v, t)) d ρ(x, v, t) = −∇(Ẋρ(x, v, t)) = − − . dt ∂x ∂v (2.12) Einsetzen der Langevingleichungen (2.10) bzw. (2.11) liefert dann d ∂ ∂ ρ(x, v, t) = − (v(t)ρ(x, v, t)) − [(−ζv(t) − V 0 (x) + Z(t))ρ(x, v, t)] dt ∂x ∂v = −v(t)∂x ρ(x, v, t) + ζ∂v (v(t)ρ(x, v, t)) + (V 0 (x) − Z(t)) ∂v ρ(x, v, t) d 1 1 bzw. ρ(x, t) = ∂x (V 0 (x)ρ(x, t)) − Z(t)∂x ρ(x, t). dt ζ ζ Die Zeitentwicklung der Aufenthaltsdichten hängt somit in jeder Evolution von der zufälligen Beschleunigung Z ab. Um eine allgemeine Entwicklung zu beschreiben soll daher um Z mit p(t) = hρ(t)iZ gemittelt werden. Unter Ausnutzung von (2.9) folgt 14 2.4. Eigenschaften der Lösung nach [63] d ζ p(x, v, t) = −v(t)∂x p(x, v, t) + ∂v [(ζv(t) + V 0 (x)) p(x, v, t)] + kB T ∂v2 p(x, v, t) dt m (2.13) bzw. 1 kB T 2 d p(x, t) = ∂x (V 0 (x)p(x, t)) + ∂ p(x, t). dt ζ ζm x | {z } (2.14) =D Dies ist in Übereinstimmung mit den Ergebnissen aus 2.2.1 und ergibt den Diffusionskoeffizienten für die mittlere Ausbreitung im Ort. Die Fokker-Planck Gleichung (2.13) ist als Kramers-Gleichung bekannt. Für den Fall großer Reibung heißt (2.14) Smoluchowski-Gleichung. Die Herleitung der Gleichungen in drei Dimensionen verläuft analog unter der Annahme, dass das Potential V (x) unabhängig in jeder Richtung ist. 2.4. Eigenschaften der Lösung Im Folgenden wird die Smoluchowski Gleichung mit einer Variablen genauer untersucht, da sie in Kapitel 3 eine weitere Rolle spielt. Erweiterungen in mehrdimensionale Systeme können in [27,65] nachgelesen werden. Die Ansätze sind in vielen Fällen analog zum Fall einer Variablen, was hier genügen soll. Zusammengefasst werden die Gleichungen (2.11) mit der daraus folgenden Fokker-Planck Gleichung (2.14) betrachtet. Dabei wird ein Schwerpunkt auf die stationäre Lösung und allgemeine Lösungsansätze mit Hilfe von Eigenwerten gelegt. 2.4.1. Stationäre Lösung Im theromdynamischen Gleichgewicht wird die stationäre Lösung der Smoluchowski Gleichung analog zu [10] erhalten. Für den Fall großer Reibung in einem Gebiet Ω mit Robin-Randbedingungen (verschwindender Fluss am Rand des Gebiets) ergeben sich 15 2. Fokker-Planck Gleichung die Gleichungen 1 ∂t p(x, t) =∇ · p(x, t)∇V (x) + D∇p(x, t) in Ω ζ 1 p(x, t)∇V (x) + D∇p(x, t) = 0 auf ∂Ω. n· ζ Für den stationären Fall folgt daraus die Boltzmann-Verteilung ∇p∞ (x) = − 1 p∞ (x, t)∇V (x) Dζ ⇒ p∞ (x) = Ce− V (x)/Dζ Für das Langzeitverhalten ist Z −V (x)/Dζ e C Ω R Ω . p dx konstant und es muss erfüllt sein Z dx = Z p∞ dx = Ω Z p0 dx = Ω p(x, 0)dx. Ω Unter anderen Randbedingungen kann die Lösung der Gleichung nicht mehr als Exponentialfunktion des Potentials berechnet werden. Zur vereinfachten Betrachtung dieser Fälle werden Vorfaktoren vernachlässigt, und somit die Gleichung in der Form ∂t p = ∇ · (∇p + p∇V ) geschrieben. Für die Betrachtung unter anderen Randbedingungen wird die SlotboomVariable u = p eV definiert (siehe dazu auch Abschnitt 2.4.3). Damit lässt sich die Gleichung umformen zu ∂t u = eV ∇ · e−V ∇u . (2.15) Für den stationären Fall folgt daraus ∇ · (e−V ∇u) = 0. Bei Dirichlet Randbedingungen n · ∇u = 0 minimiert die stationäre Lösung die Variationsformulierung Z D(ϕ) = Ω 16 e−V |∇ϕ|2 dx. 2.4. Eigenschaften der Lösung 2.4.2. Konvergenz gegen die stationäre Lösung Bei Verwendung der durch das gewichtete Skalarprodukt induzierten Norm und der Dirichlet-Randbedingungen kann die exponentiale Konvergenz gegen die stationäre Lösung gezeigt werden. Sei p∞ eine stationäre Lösung, dann gilt Z d d1 2 kp − p∞ kL2 = eV (p − p∞ )2 dx dt dt 2 Ω Z = eV (p − p∞ ) · (∂t p) dx ΩZ (2.15) = eV (p − p∞ )∇ · e−V ∇u dx Z Ω eV (p − p∞ )∇ · e−V ∇ peV dx = Ω Z Gauss = − ∇ eV (p − p∞ ) e−V ∇ peV dx. Ω Wegen R Ω p∞ dx konstant folgt d1 dt 2 Z 2 e (p − p∞ ) dx = − V Ω Z 2 e−V ∇ eV (p − p∞ ) dx. Ω Die rechte Seite kann als mit e−V gewichtete L2 -Norm aufgefasst werden. Lemma 2.2 (Poincaré-Ungleichung): Es existiert eine positive Konstante C(Ω), so dass kvkL2 (Ω) ≤ C(Ω)k∇vkL2 (Ω) für alle v H 1 (Ω) mit Z v dx = 0. Ω Beweis: Ein allgemeiner Beweis kann zum Beispiel in [9] gefunden werden. Wähle nun v = eV (p − p∞ ), dann gilt R Ω v dx = 0 per Definition von v. Mit Hilfe der 17 2. Fokker-Planck Gleichung umgestellten Poincaré-Ungleichung −||∇v||Lp ≤ − 1c ||v||Lp folgt daraus Z − −V e Ω Z 2 ∇ eV (p − p∞ ) 2 dx ≤ −1 e−V eV (p − p∞ ) dx c Ω Z −1 = eV |p − p∞ |2 dx. c Ω Durch anwenden der gewichten Norm ergibt sich die Ungleichung d −2 kp − p∞ k2L2 ≤ kp − p∞ k2L2 . dt c Lemma 2.3 (Gronwall-Ungleichung): Sei I = [0, ∞) ein Intervall in R. Sei λ : I → R stetig. Weiter sei z : I → R differenzierbar und für alle t I gelte z 0 (t) ≤ λ(t)z(t). Dann gilt für alle t I t Z z(t) ≤ z(0)exp λ(s)ds . 0 Beweis: Definiere Rt y(t) = e 0 λ(s)ds ⇒ y 0 (t) = λ(t)y(t), mit y(0) = 1 und y(t) > 0 für alle t I. Aus der Quotientenregel der Ableitung folgt durch Einsetzen der Voraussetzung d z(t) z 0 (t)y(t) − z(t)y 0 (t) = dt y(t) y 2 (t) λ(t)z(t)y(t) − z(t)λ(t)y(t) ≤ y 2 (t) = 0. Dies führt auf die Ungleichung d z(t) z(t) z(0) ≤0⇒ ≤ = z(0), dt y(t) y(t) y(0) und wegen y(t) > 0 folgt die Behauptung. 18 2.4. Eigenschaften der Lösung Mit λ(t) = −2 c konstant liefert die Gronwall-Ungleichung 1 kp − p∞ kL2 ≤ c̃ e− c t und zeigt somit eine exponentielle Konvergenz gegen die stationäre Lösung. 2.4.3. Lösungsansatz über Eigenwerte Nichtstationäre Lösungen in einer Dimension können nur für wenige spezielle Systeme explizit errechnet werden (siehe [65]). Dazu gehören der Wiener Prozess ∂t p = D ∂x2 p und der Ornstein-Uhlenbeck Prozess ∂t p = ∂x (xp) + D ∂x2 p. Ein Ansatz um nichtstationäre Lösungen zu erhalten befasst sich mit Eigenfunktionen eines transformierten Systems der Fokker-Planck Gleichung. Die folgende Vorgehensweise soll nur der Vollständigkeit dienen und wird nicht genauer untersucht. Der Ansatz ist Risken [65] und [12] entnommen und für eine genauere Vorgehensweise sei darauf verwiesen. Allgemein kann die Smoluchowski-Gleichung in Operatorschreibweise umgeschrieben werden zu ∂t p(x, t) = LF P p(x, t) LF P (x) = −∂x D(1) (x) + ∂x2 D(2) (x) 1 D(1) (x) = − ∇V (x) ζ kB T D(2) (x) = D = . ζm Als Separationsansatz wird nun p(x, t) = ϕ(x)e−λt gewählt, was zur Gleichung LF P ϕ(x) = ∂t ϕ(x) = −λϕ(x) führt. Dabei kann λ als Eigenwert zur Eigenfunktion ϕ(x) interpretiert werden. Für die Wohldefiniertheit muss der Operator LF P in einen hermiteschen Operator überführt werden. Die wird durch die Multiplikation mit der Exponentialfunktion des Potentials 19 2. Fokker-Planck Gleichung erhalten. V (x)/Dζ e LF P + =e V (x)/Dζ LF P Ist ein ϕn (x) eine Eigenfunktion zum Operator LF P mit Eigenwert λn , so ist die Funktion ψn (x) = e V (x)/2 Dζ ϕn (x) eine Eigenfunktion zum Operator L = eV (x)/2 Dζ LF P e−V (x)/2 Dζ zum selben Eigenwert λn (x). Hierbei sei noch erwähnt, dass die Eigenfunktion ϕ0 (x) zum Eigenwert λ0 = 0 wieder die Boltzmann Verteilung, also die stationäre Lösung ergibt. Die Lösung der Smoluchowski Gleichung lässt sich dann nach [12] schreiben als die Summe über alle Eigenwerte. p(x, t) = ϕ0 (x) + ∞ X ai ϕi (x)e−λi t . i=1 Für weitere Eigenschaften dieser Gleichung, auch im Kontext verschiedener Randbedingungen, sei auf [27, 65] verwiesen. Lösungsansätze für Simulationen basierend auf dem Eigenwertansatz sind Diffusion-Maps [12, 13] und deren Weiterentwicklungen [66, 79]. Hier soll die Freie Energielandschaft durch wenige Eigenfunktionen des Fokker-Planck Operators möglichst gut approximiert werden. 20 3. Modellsystem Für eine allgemeine Untersuchung von Zugkräften und ihren Eigenschaften wird hier der Einfluss von Zugkraft auf ein einzelnes Teilchen unter Brownscher Bewegung in einem Potential betrachtet. Die Idee ist, dieses Teilchen und sein Verhalten zu beobachten um die Einwirkung von externer Kraft, hier das Ziehen, zu analysieren. In diesem Kapitel wird eine vereinfachte und skalierte Version der Smoluchowski Gleichung aus Kapitel 2 zur Beschreibung des Systems genutzt. Wichtige Annahmen sind dabei, dass ein Teilchen mit Masse 1 als Punkt ohne Radius betrachtet wird und die Diffusion als Zufallskraft eingeht. Zusätzlich wird der Fall großer Reibung angenommen. Zuerst wird der Fall in einer Dimension ohne Zugkraft betrachtet und auf Anwendbarkeit überprüft. Für die Zugexperimente wird in Abschnitt 3.2 das System auf den zweidimensionalen Fall erweitert und die externe Zugkraft hinzugeführt. Untersucht wird das Verhalten für unterschiedliche Werte von Federkonstante und Zuggeschwindigkeit. Vergleiche mit Simulationen an Proteinen sind in Kapitel 5 gegeben. 3.1. Beschreibung des Systems Betrachtet wird ein Teilchen unter Brownscher Bewegung in einem Potential. Aus Abschnitt 2.2 wird der Fall großer Reibung angenommen. Dadurch ergibt sich für die Bewegungsgleichung des Teilchens die Smoluchowski-Gleichung (2.14) 1 ∂t p(x, t) = D∆p(x, t) + ∇ · [∇V (x) · p(x, t)]. ζ (3.1) Dabei beschreibt x(t) den Ort des Teilchens zum Zeitpunkt t und D = kBζ T ist der Diffusionskoeffizient, hergeleitet in Abschnitt 2.2.1. Weiter ist V (x) das zugrunde liegende Potential, welches auf das Teilchen wirkt. Zur Überprüfung der Annahmen und zum Testen der Implementierung soll zunächst ein harmonisches Potential als Grundlage 21 3. Modellsystem dienen V (x) = x2 . Weiter wird der Diffusionsterm als Zufallsterm betrachtet. Wie schon in Abschnitt 2.2.1 gezeigt wurde kann die Varianz im Ort als hx2 (t)i = 2D∆t mit Mittelwert hx(t)i = µ = 0 dargestellt werden. Daraus folgt für den Diffusionsterm eine gaußverteilte Zufallszahl p mit Standardabweichung σ = 2kB T ∆t/ζ und Mittelwert µ = 0. Die Bewegung des Teilchens wird vereinfacht nur durch das Potential und die Zufallskraft als Diffusion beschrieben. Dabei soll diskret in der Zeit, und kontinuierlich im Ort simuliert werden. Für die numerische Umsetzung soll das explizite Eulerverfahren genügen. Durch die Einfachheit des Systems kann die kürzere Simulationszeit dem stabilen impliziten Verfahren vorgezogen werden. Auf Verfahren mit höherer Genauigkeit wurde aus den selben Gründen verzichtet (siehe dazu [26]). Allgemein wurde somit folgende Gleichung umgesetzt x(t + ∆t) = x(t) − V 0 (x)/ζ · ∆t + rand(0, p 2kB T ∆t/ζ). (3.2) Implementiert wurde in C++. Eine kurze Beschreibung des Programms und seiner Routinen ist im Anhang B zu finden. Getestet wurde das System für kleine mit kB skalierte Temperaturen, vorwiegend T = 1. 3.1.1. Testen der Implementierung Im stationären Fall, der dem thermodynamischen Gleichgewicht entspricht, ist die Lösung der partiellen Differenzialgleichung gegeben durch x∞ = e − V (x)/Dζ x2/k T B = e− . Somit kann für jeden Ort die Energie des Systems berechnet werden. Physikalisch wird die Aufenthaltswahrscheinlichkeit in jedem Ort durch die Zustandssumme beschrieben Z Z(β) = 22 e−βH(z) dz 3.1. Beschreibung des Systems Abbildung 3.1.: Berechnete Freie Energie und Potential, Abweichungen sind unten angegeben. mit β = kB1T . Der Hamiltonian H(x) ist eine Funktion, die die Energie des Systems beschreibt, hier also V (x). Die Freie Energie berechnet sich durch die Formel [31] 1 F (β) = − ln(Z(β)). β Durch eine genügend lange Simulation sollte der gesamte Raum ausreichend gut erfasst werden. Die Zustandssumme kann dann durch die normierten Aufenthaltswahrscheinlichkeiten in jedem Ort ausgedrückt werden. Hier beschreibt p0 die größte gemessene Wahrscheinlichkeit. Für die Freie Energie sollte daher bei unendlich langer Simulation gelten F (x) = −kB T ln(p(x)/p0 ). Hier wurde dazu das Gebiet in Gitterpunkte geteilt um die diskrete Wahrscheinlichkeitsdichte zu erhalten. Die Zeitschrittweite ist als ∆t = 0.001 gewählt. Als Abbruchkriterium wurden 106 Schritte durchgeführt und die Ergebnisse von 1000 Rechnungen gemittelt. Die errechnete Freie Energie aufgetragen mit der Funktion x2 als Vergleich ergibt für niedrige Temperaturen eine sehr gute Übereinstimmung (siehe Abbildung 3.1). Die Abweichungen am Rand werden durch die endliche Simulationszeit begründet, da energetisch ungünstige Zustände nicht genügend gut abgebildet werden. 23 3. Modellsystem 3.1.2. Doppelmuldenpotential Für Zugexperimente ist es notwendig ein System mit mindestens zwei Energieminima und einer zu überwindenden Enerigebarriere zu betrachten, um den Übergang zwischen zwei Zuständen beschreiben zu können. Da bei dieser Analyse eine Unterscheidung zwischen den Minima nicht essenziell ist, wird auf ein symmetrisches Doppelmuldenpotential zurückgegriffen. Später wird in Kapitel 5 das Ziehen eines Proteins von einem stabilen Zustand in einen anderen simuliert. Dort können die Minima von unterschiedlicher Tiefe sein. Das Potential wird somit wie folgt dargestellt: V (x) = ε (x2 − 1)2 . Eine Anpassung des Potentials ist jederzeit möglich. Um die Barrierenhöhe variabel zu halten ist ε ein mit kB skalierter Parameter. Das System wird also durch die Temperatur T und den Parameter ε gesteuert, skaliert mit kB . Um einen Bezug zu Zugexperimenten an Biomolekülen herstellen zu können sind Systeme mit kleiner Systemtemperatur und großer Barrierenhöhe von Interesse, da dort ein Übergang auf natürliche Weise nur selten vorkommt. Getestet wurde das System wie im obigen Abschnitt über die Freie Energieberechnung durch die Aufenthaltswahrscheinlichkeiten. Wie in Abbildung 3.2 ersichtlich, ergeben sich auch hier für die Werte nahe der Minima eine gute Übereinstimmung mit dem tatsächlichen Potential. An der Energiebarriere sind Abweichungen erkennbar. Mögliche Ursachen können die Diskretisierung der kontinuierlichen Ortskoordinaten oder Approximationsfehler sein. Aber auch die endliche Simulationszeit kann dazu führen, dass der Übergangszustand nicht ausreichend gut dargestellt werden kann (rare event Sampling). Der nächste Schritt zur Prüfung des Systems auf eine genügend gute Approximation besteht im Vergleich der Übergangsraten zu verschiedenen Temperaturen. Um einen Übergang klar zu definieren wurde ein Bereich um das Maximum als Gebiet bezeichnet. Ein Übergang wird als das Betreten des Gebietes an einer Seite und Verlassen auf der anderen Seite definiert. Getestet wurden kleine Temperaturen unter hoher Barrierehöhe. Die Übergangsraten gegen die Temperatur im Arrhenius-Plot sollten ein lineares Verhalten zeigen. Abgebildet in Abbildung 3.3 sind beispielhaft die Arrhenius-Plots für Barrierehöhen zwischen 5 und 10 kB T . Besonders für große Barrierehöhen kann ein lineares Verhalten festgestellt werden. Ausgehend von den bisherigen Ergebnissen wurde das System als ausreichend für Zugexperimente auf einfachster Ebene angesehen und für diesen Zweck im nächsten Abschnitt erweitert. 24 3.2. Zugexperimente in 2D (a) Energiebarriere mit ε = 5 (b) Energiebarriere mit ε = 10 Abbildung 3.2.: Freie Energieberechnung im Doppelmuldenpotential, die Minima werden gut abgebildet, an der Energiebarriere sind Approximationsfehler zu erkennen. 3.2. Zugexperimente in 2D In den Simulationen sollen die Parameter von Zuggeschwindigkeit und Federkonstante weiter untersucht werden. Bei realen Systemen kann durch das Ziehen ein Hysterese Effekt hervorgerufen werden, also eine Veränderung des Reaktionsweges zwischen Ziehen und Relaxieren. Um dies abbilden zu können muss die Energielandschaft diese Varianten zulassen. Aus diesem Grund wurde ein zweidimensionales System gewählt, sodass der Übergang von einem Minimum ins Andere an verschiedenen Stellen stattfinden kann. Nachdem das Programm in einer Dimension gute Ergebnisse liefert kann eine Erweiterung um eine zweite Dimension und die Implementierung einer Zugkraft vorgenommen werden. Das Potential wurde so gewählt, dass der energetisch günstigste Übergang zwischen den Minima nicht auf der direkten Verbindung liegt. Die Reaktionskoordinate in x-Richtung kann hier als Abstand interpretiert werden, die Reaktionskoordinate in y-Richtung entspricht dann einem beliebigen anderen Eigenwert, durch den ein Zustand beschrieben werden kann. Analog zu Zugexperimenten an Biomolekülen wird als Zugkraft ein harmonisches Potential genutzt (siehe dazu Kapitel 5). In diesem Abschnitt werden die genannten Schritte erläutert und getestet. Anschließend werden die Ergebnisse der Simulationen diskutiert. 25 3. Modellsystem Abbildung 3.3.: Arrhenius-Plots der Übergangsraten zeigen annähernd lineares Verhalten besonders für große Barrierehöhen. 3.2.1. Potential in 2D Die zweite Dimension wird analog zur Ersten programmiert, das Teilchen kann nun in x- und in y-Richtung wandern. Die Wahrscheinlichkeit für die Diffusion ist in beide Richtungen gleichverteilt. Zur Steigerung der Effektivität und Verbesserung der Zufallszahlgenerierung wird statt dem Box-Mueller Algorithmus nun der Tausworthe 2 Generator [40, 41] aus der Gnu Scientific Library (GSL) genutzt. Wichtig für die Wahl des Potentials ist die Zielsetzung der Simulationen. Der energetisch günstigste Reaktionsweg soll nicht auf der direkten Verbindung der zwei Minima liegen um eine Veränderung des Reaktionsweges durch Zugkräfte zu ermöglichen. Zusätzlich kann das Potential mit einem Parameter ε so gesteuert werden, dass die Höhe der Energiebarriere anpassbar ist. Als eine möglichst einfache Darstellung eines solchen Potentials dient die Funktion V (x, y) = 2 ε (y + (x2 − 1))2 + ε (x2 − 1)2 . (3.3) ε ist analog zum 1D Fall mit kB skaliert. Die beiden lokalen Energieminima liegen somit bei (−1, 0) und (1, 0), und der energetisch günstigste Übergang sollte bei (0, 1) stattfinden. Eine Darstellung in Höhenlinien ist in Abbildung 3.4(a) gegeben, die Errechnung der Freien Energie analog zu vorherigen Abschnitten ist in Abbildung 3.4(b) gezeigt. Bei der Freien Energieberechnung ist deutlich zu erkennen, dass die direkte Verbindung zwischen den beiden Minima kaum gesampelt wurde. Dies ist interessant für die anschließenden Zugsimulationen. 26 3.2. Zugexperimente in 2D (a) Höhenlinien des Potentials für ε = 10 (b) freie Energierechnung für ε = 10 Abbildung 3.4.: Darstellung des Potentials. 3.2.2. Erweiterung zum Zugexperiment Analog zu Zugsimulationen an Biomolekülen wird ein harmonisches Potential zum Ziehen genutzt. Dabei dient ein sogenanntes Dummy Atom als Punkt, von dem die Zugkraft ausgeht. Als Ausgangspunkt dient ein Teilchen im Minimum bei (-1,0). Der Zugpunkt startet an der selben Stelle und bewegt sich mit konstanter Geschwindigkeit in Richtung des anderen Minimums. Dadurch wird dem Teilchen pro Schritt eine Kraft entlang dieser Richtung hinzugefügt. Das harmonische Potential wird dargestellt als Vp (x) = k/2 (x − x0 )2 , (3.4) mit Federkonstante k und x0 der aktuellen Zugposition. Die Zugeschwindigkeit bestimmt die Rate mit der x0 pro Zeitschritt wächst, x0 (t) = x0 (t−∆t)+v ·∆t. Dabei gilt für den Startwert x0 (0) = x(0). Die auf das Teilchen einwirkende Kraft in x-Richtung besteht somit aus der Summe der Potentialkraft mit der Zugkraft −∇Vges (x) = −∇x V (x) − ∇Vp (x) = −8 ε x (y + (x2 − 1)) − 4 ε x (x2 − 1) − k (x − x0 ). Für k = 1 ist die Zugkraft auf das Teilchen gleich dem Abstand zum Dummy Atom und repräsentiert somit eine weiche Feder. Der Fall von k = 0 repräsentiert eine unendlich weiche Feder und dadurch eine Simulation ohne Zugkraft. Um Vergleiche mit späteren MD-Simulationen an Biomolekülen aus Kapitel 5 durchzuführen wird hier verstärkt Ziehen mit weicher Feder betrachtet werden. Interessante Werte sind die Einflüsse des 27 3. Modellsystem Ziehens auf die Schrittzahl bis zur Überschreitung der Energiebarriere und der Ort der Überquerung. Desweiteren sollen Kraftkurven bezüglich der Zeit und des Abstands zum Startpunkt untersucht werden. Definiert wird das Erreichen der Energiebarriere sobald der x-Wert des Teilchens den Wert 0 überschreitet. Als Erreichen des Minimums zählt ein x-Wert in einer Umgebung von 1 ± ε. Hier soll ein Wert von 0.1 für ε reichen. 3.2.3. Analyse der Parameter Durch zu starke Fluktuationen wurden die folgenden Zugsimulationen bei einer Barrierehöhe mit ε = 20 durchgeführt. Ohne Zugkraft ergaben Simulationen eine mittlere Anzahl von etwa 5380 benötigten Zeitschritten um die Energiebarriere zu überwinden. Dabei liegt die Standardabweichung bei etwa 5320 Schritten, was auf einen großen Einfluss der Diffusion deutet. Gemittelt wurde hier über 105 Simulationen. Die Wahl der Zuggeschwindigkeit sollte sich danach richten, dass das Dummy Atom bis zu dem Zeitpunkt der natürlichen Überwindung die Barriere überschritten haben sollte, da sonst ein Ziehen in die entgegengesetzte Richtung erfolgt. Nach dem Mittelwert sollte eine Zuggeschwindigkeit für langsames Ziehen daher bei mindestens v = 0.2 liegen. 3.3. Ergebnisse Zunächst soll das allgemeine Verhalten des Teilchens analysiert werden. Dabei ist neben der mittleren Anzahl auch die Standardabweichung der Schrittzahl interessant. Zusätzlich geben die Ergebnisse der Kraft-Zeit Kurven Aufschluss über das Verhalten des Teilchens. Simulationen mit Geschwindigkeit v = 0.2 und einer weichen Feder (k = 1.0) führen auf eine mittlere Schrittzahl von etwa 5000, die Standardabweichung von etwa 4300 Schritten deutet auf einen großen Bewegungsfreiraum hin. Ziehen mit einer steifen Feder von k = 100 ergeben eine mittlere Schrittzahl von 3400 mit einer Standardabweichung von nur noch 440 Schritten, also sowohl eine Verkürzung der Simulationszeit als auch mehr Einschränkungen für das Teilchen. Eine Betrachtung der Kraftkurve für eine Simulation mit sehr steifer Feder zeigt, dass die mittlere Kraft auf das Teilchen bei dieser Feder tatsächlich bei etwa 0 liegt (siehe Abbildung 3.5(a)). Das Teilchen folgt also der Bewegung des Dummy Atoms, eine Abweichung wird durch die große Zugkraft bestraft. In Abbildung 3.5(b) ist eine typische Kraftkurve bei weicher 28 3.3. Ergebnisse (a) Federkonstante k=800 (b) Federkonstante k=1 Abbildung 3.5.: Kraft-Zeit Kurven für das Ziehen mit Geschwindigkeit v = 0.2. Feder zu sehen. Analoge Kurven im Fall einer weichen Feder werden auch in Zugsimulationen an Biomolekülen erhalten (siehe dazu Kapitel 5). Benötigte Schrittanzahl Für eine genauere Analyse der Abhängigigkeit der Schrittzahl von der Wahl der Federkonstanten und Zuggeschwindigkeit wurden Simulationen mit k = 1 − 20 durchgeführt bei Geschwindigkeiten von v = 0.2 − 1.0. Die mittlere Schrittzahl und ihre Standardabweichung sind in Abbildung 3.6 gegeben. Deutlich zu erkennen ist, dass die Wahl der Federkonstanten nur einen geringen Einfluss auf die mittlere Schrittanzahl hat. Dagegen veringert sich die Standardabweichung deutlich, da steifere Federn weniger Fluktuationen des Teilchens zulassen. Auf der anderen Seite zeigt sich eine deutliche Verringerung der Schrittzahl durch steigende Zuggeschwindigkeit, unabhängig von der Federkonstante. Zusammenfassend beeinflusst die Geschwindigkeit die Schrittanzahl für das Erreichen der Barriere und die Federkonstante die Möglichkeiten der Diffusion. Der Ort des Übergangs Weitere Eigenschaften der Zugkraft soll der Ort des Übergangs liefern. Die Vermutung ist, dass bei langsamem Ziehen mit weicher Feder der Übergang nahe des energetischen Minimums der Energiebarriere stattfindet. Hingegen wird bei zu schnellem Ziehen und 29 3. Modellsystem Abbildung 3.6.: Abhängigkeit der Schrittzahl von der Federkonstanten. steifer Feder ein Übergang nahe der direkten Verbindung der Minima erwartet. Das energetische Minimum der Energiebarriere liegt im Punkt (-1,0). Rechnungen ohne Zugkraft zeigen einen mittleren Übergang an der Stelle y = 0.97 mit einer Standardabweichung von 0.23. Die leichte Abweichung wird dadurch erklärt, dass zusätzlich zum energetisch günstigsten Übergang auch der kürzeste Weg Einfluss hat. Zu den gleichen Werten wie oben ist in Abbildung 3.7 der y-Achsenabschnitt und die dazugehörige Standardabweichung aufgetragen. Auffallend ist, dass beide Parameter kaum Einfluss auf den Ort des Übergangs haben. Auch Extremrechnungen mit Geschwindigkeiten v > 1 und Federkonstanten k > 100 zeigen keine deutliche Veränderung. Eine mögliche Erklärung liegt in der Steigung der Energielandschaft. Der Weg die Energiebarriere zu überwinden ist an abweichenden Stellen zu ungünstig. Eine zu niedrige Barriere begünstigt dagegen auch die Fluktuationen in den Kraft-Zeit Kurven und wurde deshalb nicht gewählt. Kraft Kurven Ziel der Betrachtung dieses einfachen Modells war unter anderem Kraft Kurven ähnlich zu denen aus Zugexperimenten erzeugen zu können. Eine Analyse von Zugkräften an Biomolekülen ist in Abschnitt 5.3.3 dargestellt. Die Kraftkurve gibt die Kraft, die durch das harmonische Zugpotential entsteht, wieder. Betrachtet wird die Zeitentwicklung der 30 3.3. Ergebnisse Abbildung 3.7.: Abhängigkeit des Übergangsortes von der Federkonstanten. Kraft, sowie die Abhängigkeit der Kraft vom Abstand des Teilchens zum Startpunkt. Für weiche Federn zeigt sich eine gute Übereinstimmung mit Daten aus experimentellen Zugexperimenten, sowie Simulationen (siehe dazu Kapitel 5 und Abbildung 3.5(b)). Bei Kraft-Zeit Kurven steigt die Kraft im Schnitt linear an, bis sie groß genug ist um dem Teilchen die Überwindung der Energiebarriere zu ermöglichen. Erkennbar ist dies am plötzlichen Absinken der Kraft. Bei Kraft-Abstand Kurven ist die Zugkraft gegen den Abstand des Teilchens zum Ursprung aufgetragen. Ein Abfall der Kurve mit steigendem Abstand deutet hier auf einen Sprung hin. Wie schon in Abbildung 3.5 gezeigt varriieren die Kraft Kurven stark in Abhängigkeit der gewählten Parameter. Wichtig hierbei ist die Wahl weicher Federkonstanten, um dem Teilchen möglichst viel Freiraum für Bewegungen zu geben. Eine genauere Analyse der Kraftkurve aus 3.5(b) liefert die Kraft-Abstand Kurve dieser Rechnung. In Abbildung 3.8 ist diese Kurve gegeben. Hier entspricht die x-Achse dem Abstand des Teilchens vom Startpunkt (-1,0), der im ersten Minimum gewählt ist. Dadurch liegt die Barriere bei 1 und das andere Minimum bei 2. Es ist deutlich zu erkennen, dass das Teilchen zunächst in der Nähe des Minimums bleibt, bis die Kraft zu groß wird und das Teilchen nach der Überwindung der Barriere sofort in das zweite Minimum wandert. Durch hohe Fluktuationen bei niedrigen Geschwindigkeiten (siehe Standardabweichung der Schrittzahl) entstehen auch Kraftkurven wie in Abbildung 3.9 gezeigt. Die 31 3. Modellsystem Abbildung 3.8.: Kraft-Abstand Kurve für v = 0.2 und k = 1. schwankende Kraft um 0 in 3.9(a) deutet darauf hin, dass sich das Teilchen in der Gegend des Dummy Atoms aufhält. Beim ‘Überholen’ wird es nach einiger Zeit wieder zurückgezogen. Die Kraft-Abstand Kurve in 3.9(b) zeigt, dass dadurch das Teilchen nach dem Überqueren der Energiebarriere wieder zurück geht (mehrfache Linien bei einem Abstand größer 1). Die negative Kraft am Ende der Kurve deutet darauf hin, dass die Kraft in das Minimum zu gehen vor der Zugkraft überwiegt. In Abbildung 3.9(c) ist das Gegenteil der Fall. Hier bleibt das Teilchen trotz der Zugkraft auf der Seite des Startpunktes (siehe Abbildung 3.9(d)). Um den Übergang zu erzwingen ist daher eine sehr viel höhere Kraft nötig. Dieser Fall kann nur bei weichen Federn auftreten, da sonst die Zugkräfte zu groß sind. Bei steigender Zuggeschwindigkeit treten solche Fälle häufiger auf. In Abbildung 3.10 sind die Kraft-Zeit Kurven zu verschiedenen Geschwindigkeiten gezeigt. Noch immer ist der Sprung erkennbar, die Schwankungen sind jedoch größer. Durch eine gestiegene Geschwindigkeit ist die Zugkraft auf das Teilchen schnell größer als die Potentialkraft. Nach dem Relaxieren der Feder überwiegt wieder die Potentialkraft und das Teilchen wandert in die entgegengesetzte Richtung. Dadurch kommt es zu den Fluktuationen in den Kurven. Die Grenzfälle aus Abbilding 3.9 treten mit steigendem v vermehrt auf. Grenzen des Modells Eine große Schwierigkeit liegt in der Wahl der Parameter. Sehr große Werte für die Federkonstante, vor allem k > 1600, zeigen die Limitationen der Vereinfachung. Durch die großen Werte von k, scheint sich das System ‘aufzuschaukeln’. In diesem Fall liegt 32 3.3. Ergebnisse (a) Federkonstante k=1 (b) Federkonstante k=1 (c) Federkonstante k=1 (d) Federkonstante k=1 Abbildung 3.9.: Kraft Kurven für das Ziehen mit Geschwindigkeit v = 0.2. der Ort des Übergangs im negativen Bereich. Für vernüftige Ergebnisse bei extremer Feder muss daher die Schrittweite ∆t verkleinert werden. Auf eine vorsichtige Wahl der Parameter sei daher auch in diesem Modell hingewiesen. Fazit Für eine weiche Federkonstante ist es mit diesem vereinfachten Modell möglich typische Kraft-Zeit und Kraft-Abstand Kurven zu generieren. Zusätzlich kann eine Abhängigkiet der Simulationszeit von der Zuggeschwindigkeit nachgewiesen werden. Auch der Einfluss der Federstärke auf das Fluktuationsverhalten ist deutlich nachweisbar. Allerdings konnten keine veränderten Übergänge durch zu schnelles Ziehen gezeigt werden. Obwohl die Limitationen dieses Modells offensichtlich scheinen, bildet es so eine gute 33 3. Modellsystem (a) Zuggeschwindigkeit v = 0.6 (b) Zuggeschwindigkeit v = 0.6 (c) Zuggeschwindigkeit v = 1.0 (d) Zuggeschwindigkeit v = 1.0 Abbildung 3.10.: Kraft-Zeit Kurven, und Kraft-Abstand Kurven, verschiedene Zuggeschwindigkeiten bei k = 1. Grundlage für weitere Analysen. Für Vergleiche mit Simulationen an Biomolekülen wird im nächsten Kapitel eine Einführung in Biomoleküle auch vor dem Hintergrund von Computersimulationen gegeben. 34 4. Biomoleküle Biologische Moleküle, kurz Biomoleküle, besitzen in biologischen Systemen vielfältige Aufgaben. Angefangen bei kleinen Biomolekülen, wie Peptiden, Aminosäuren und Vitaminen, mit einigen wenigen Atomen, über Proteine, bis hin zur DNA, welche aus Millionen von Nukleotiden bestehen kann, treten Biomoleküle in unendlicher Vielfalt auf. Sie bilden den Grundbaustein für jeglichen Organismus und steuern viele Prozesse, die zum Leben notwendig sind. Doch vor allem bei Macromolekülen, wie zum Beispiel Proteinen, ist ihre genaue Funktion und Funktionsweise meist noch nicht geklärt. Um Vorgänge in biologischen Systemen besser verstehen zu können, ist eine genaue Betrachtung von ihnen erforderlich. Proteine bestehen aus Aminosäuren (auch Residuen genannt) und ihren Derivaten. Aminosäuren wiederum bestehen aus Kohlenstoffverbindungen mit mindestens einer Amino- und Carboxygruppe. Es gibt 22 proteinogene Aminosäuren, welche die Grundlage von Proteinen bilden. Sie legen den Grundbaustein für den genetischen Code des Menschen. Biomoleküle werden mit verschiedenen Methoden analysiert. Wichtige Faktoren betreffen die Untersuchung des Aufbaus, der Bestandteile und des physikalischen Verhaltens. Aber auch Interaktionen mit der Umgebung spielen eine große Rolle. Ziel ist es, durch die Analyse der Eigenschaften von Biomolekülen die Funktionsweise biologischer Systeme besser zu verstehen um dann bei Bedarf Einfluss darauf zu nehmen, zum Beispiel bei der Entwicklung neuer Medikamente. Ein Anwendungsbeispiel ist in [42] mit der Stabilitätsanalyse des Alzheimer’s Amyloid Protofibrils gegeben. Die Anzahl an neu entdeckten und entwickelten Biomolekülen steigt rapide an und selbst die Eigenschaften bekannter Moleküle sind noch nicht vollständig erforscht. Dadurch besteht eine große Nachfrage an Analysemethoden und -techniken und deren Verbesserung. Im folgenden Abschnitt wird als Beispiel einer Analysemethode das Atomic Force Microscope (AFM) [4] mit seinen Anwendungsmöglichkeiten vorgestellt und seine Bedeutung für die Analyse von Biomolekülen erläutert. Anschließend werden in diesem Zusammenhang MD-Simulationen diskutiert. Zuletzt wird das Miniprotein TC5b vorgestellt, welches in Kapitel 5 dieser Arbeit beispielhaft untersucht wird. 35 4. Biomoleküle Abbildung 4.1.: Aufbau eines AFM. Abbildung aus [62] 4.1. Untersuchung mit AFM Der erste Schritt zur Aufklärung bestimmter Eigenschaften eines Biomoleküls ist die Analyse seiner Struktur. Seine Zusammensetzung und sein Aufbau bilden eine gute Grundlage zum Verständnis der physikalischen Eigenschaften. Dabei geben Aussagen über die enthaltenen Atome, Restgruppen, Ladung und Grundstruktur erste Anhaltspunkte. In dieser Arbeit wird aber nicht die Analyse solcher Eigenschaften Thema sein, sondern vielmehr eine grundsätzliche Herangehensweise erläutert werden, mit welchen Mitteln genauere Informationen über Biomoleküle erlangt werden können. Beispielhaft wird hier das Atomic Force Microscope (AFM) [4] als mögliches Werkzeug betrachtet, da es einige wichtige Eigenschaften hat, auf die in Kapitel 5 genauer eingegangen wird. Andere Untersuchungstechniken sind die Analysen mit weiteren Mikroskopen, Nuclear Magnetic Resonance (NMR) Aufnahmen oder X-ray Bilder. Das AFM wurde von Binnig et al entwickelt und zuerst 1986 vorgestellt [4]. Es ist eine Weiterentwicklung des Scanning Tunneling Microscope (STM [5–7]) und gehört zur Familie der Scanning Probe Microscopes (SPM) [62,74]. Eine Spitze, angebracht an einer Feder, tastet die Oberflächenstruktur des Moleküls ab. Durch das Anlegen externer Kräfte, wie elektrischen Fluss oder ein magnetisches Kraftfeld, werden Wechselwirkungen zwischen der Spitze und der Probe erzeugt [62]. Gemessen wird die Verformung der Feder mit Hilfe von optischen Sensoren anhand des Einfallswinkels reflektierter Strah- 36 4.2. Untersuchung durch Simulationen len (siehe Abbildung 4.1). Um die einwirkenden Kräfte zu messen muss dazu zwingend die Beweglichkeit der Feder bekannt sein. Die Bestimmung der Steifheit der Feder ist deshalb ein wichtiger Schritt zu validen Messergebnissen [52]. Vorteil gegenüber anderen Messmethoden ist vor allem die mögliche Größe der Probe, die laut Neuman und Nagy [52] zwischen 100-250 µm liegt. Das AFM ist besonders deshalb interessant für die Analyse von Biomolekülen, weil es auch für Untersuchungen in Lösung geeignet ist. Das kommt einer physiologischen Umgebung nahe und das Molekül kann sich dort ähnlich wie in seiner natürlichen Umgebung verhalten [50, 52]. Die Messgenauigkeit hängt (außer vom Scanner) wesentlich von Feder und Spitze ab. Das Material (diamanten in [4], aus Silizium in [55]) und Form der Spitze sowie der Feder (durch funktionale Beschichtungen [52]) beeinflussen das Messergebnis. So wurde 2008 in [52] beim Umfang der messbaren Kräfte 10-104 pN genannt, doch 2011 in [62] tauchen Angaben von 10−2 -105 nN bei hinreichend guter Feder auf, was einer Verbreiterung des möglichen Messerbereichs entspricht. Auch die Art der Probe hat einen großen Einfluss auf das Messergebnis, in Abhängigkeit davon, wie sensitiv sie mit der Spitze reagiert. Weiche Proben können sich unter dem Einfluss der Spitze verbiegen und so die Schärfe der Aufnahmen negativ beeiträchtigen. Andererseits können zu scharfe Spitzen zur Verletzung der Probe führen [62]. Das AFM besitzt viele sogenannter Moden. Je nach Einstellung und Erweiterung des Apparates können unterschiedliche Eigenschaften des Biomoleküls gemessen werden. So sind neben der Oberflächenanalyse auch Messungen der Elastizität, Bindungsstärken, oder Oberflächenladungen möglich [21, 24]. Auf eine weitere Anwendungsart des AFM wird später in Kapitel 5 eingegangen. Für eine Sammlung von Anwendungsbeispielen an Biomolekülen sei auf [50, 62] verwiesen. 4.2. Untersuchung durch Simulationen Die Untersuchung von Biomolekülen durch Computersimulationen ist ein rapide wachsender Forschungszweig. Nicht nur die steigende Rechenleistung durch Cluster und Hochleistungscomputer erweitert die Möglichkeiten der Simulationen. Der Ausbau von Programmen durch verbesserte Implementierung und neue Näherungsverfahren wie Coarse Grain Modelling [75] erlaubt Berechnungen immer größerer Systeme. Kraftfelder für immer speziellere Anwendungsgebiete erlauben verbesserte Ergebnisse. Eine Zusammenfassung und Darstellung der aktuellen Fortschritte ist in [18] gegeben. Als 37 4. Biomoleküle Basis für die Modellierung eines Systems mit Biomolekülen dienen experimentell erworbene Strukturen, weltweit gesammelt in der RCSB Protein Data Bank (PDB). Unterschieden werden Simulationen auf Quanten- und Molekularebene. Sogenannte QM-Simulationen (Quantum Mechanic) können bis zu mehrere hundert, aktuell sogar wenige tausend Atome berechnen, auf Zeitskalen bis zu wenigen Picosekunden. Sie basieren hauptsächlich auf der Dichtefunktionaltheorie (DFT) und der Berechnung mit Hilfe von Wellenfunktionen [33, 71]. Verbreitete Funktionale für die Berechnungen sind zum Beispiel B3LYP oder PWPB95. Molekulardynamik Simulationen (MD) behandeln Größen von Anordnungen bis zu mehreren 10000 Atomen und spielen daher eine große Rolle in der Erforschung von Biomolekülen. Hier werden Ort und Geschwindigkeit von Teilchen, welche die Atome repräsentieren, anhand von Newton’s Bewegungsgleichung berechnet. Ein wichtiger Faktor ist die Wahl des Kraftfeldes, das bestimmt, wie stark die verschiedenen Kräfte auf die Teilchen einwirken. Ein Überblick wird in [75] gegeben und genauere Informationen sind in den entsprechenden Referenzen enthalten. Trotz der bedeutsamen Entwicklungen der letzten Jahre liegen die zeitlichen Grenzen von Simulationen noch immer weit unterhalb derer aus experimentellen Versuchen. Noch immer gibt es viele Phänomene, die außerhalb der simulierbaren Zeit liegen und deshalb nicht modelliert werden können [18, 75]. Auch die Anzahl der Atome von Molekülen spielen dabei eine große Rolle. Vor allem große Proteine und Abschnitte der DNA enthalten mehr Atome als mit heutigen Methoden simulierbar ist. Mit Coarse Grain Modellen wird versucht dieses Problem zu umgehen, in dem bestimmte Atome zu Gruppen zusammengefasst werden. Die Einsparung in Simulationszeit kann bedeutend sein, doch durch diese Vereinfachung gehen Informationen verloren und Ergebnisse sollten mit Vorsicht interpretiert werden. Eine Einführung in Coarse Grain Modellierung wird in [43, 44] gegeben. Generell sollten Simulationen mit Sorgfalt betrachtet und, wenn möglich, mit experimentellen Ergebnissen verglichen werden. Ergebnisse hängen besonders von Parametern wie Kraftfeldern, Thermostaten und Equilibrierungen ab und können bei unsorgsamer Wahl zu Ergebnissen führen, die signifikant vom natürlichen Verhalten der Moleküle abweichen. Im weiteren Verlauf dieser Arbeit wird exemplarisch eine MD-Simulation zur Analyse des Faltungsweges eines einfachen Miniproteins betrachtet. Dazu dient das Mini- 38 4.3. Trp-cage Molekül TC5b Abbildung 4.2.: Trp-cage Miniprotein TC5b, Moleküldarstellung erstellt mit VMD [29] Protein TC5b als Beispiel, welches vor allem wegen seiner geringen Größe für die Forschung interessant ist. Der nächste Abschnitt gibt eine kurze Beschreibung dieses Biomoleküls. 4.3. Trp-cage Molekül TC5b Das Miniprotein Trp-cage TC5b wurde von Neidigh et al. [51] konstruiert (siehe Abbildung 4.2). Es besteht aus 304 Atomen und insgesamt 20 Aminosäuren (Abfolge: NLYIQWLKDGGPSSGRPPPS) und ist damit eines der kleinsten Biomokelüle, die eine wohldefinierte Faltung vorweisen. Die Residuen 2-8 bilden eine α-Helix, Residuen 11-14 eine 310 -Helix. Seine Struktur ist in der PDB Datenbank unter der Kennung 1L2Y verfügbar. Durch die geringe Anzahl an Atomen und die daraus resultierende kurze Simulationszeit ermöglicht direkte Vergleiche zwischen Experiment und Simulation und wurde daraufhin untersucht [47, 60, 67, 70]. Die Ergebnisse aus MD-Simulationen unter verschiedenen Vorraussetzungen sind der genannten Literatur zu entnehmen. Die geringe Simulationsdauer, die Größe, das bereits vorhandene Wissen über seine Eigenschaften und der schon analysierte Entfaltungsweg sind der Grund für die Wahl dieses Miniproteins für die Simulationen in dieser Arbeit. Im folgenden Kapitel wird die Bedeutung von Zugexperimenten vor dem Hintergrund der Erforschung des Entfaltungsweges erläutert, erst experimentell, dann durch Simulationen und zuletzt beispielhaft anhand des Trp-cage. 39 5. Zugexperimente Eine wichtige Eigenschaft von Proteinen und anderen großen Biomolekülen ist ihre Möglichkeit sich zu falten und zu entfalten. Das zentrale Interesse an der Untersuchung der Entfaltungswege rührt daher, dass durch die Streckung oder Denaturierung, bzw. die Formation einer anderen Konfiguration, Biomoleküle verschiedene Eigenschaften vorweisen. Durch fehlerhafte Faltungen ist somit die Funktionsfähigkeit der Proteine nicht gewährleistet und kann sogar zu Krankheiten (Proteinfaltungskrankheiten wie Amyloidose [49, 54]) führen. Die Erforschung dieser Übergänge ist somit von großer Bedeutung. Zusätzlich spielt die Entfaltung und Faltung eine Rolle bei der transkription der DNA und der Wanderung von Biomolekülen durch Nanoporen. Unter welchen Bedingungen der Faltungsvorgang abläuft ist noch nicht vollständig geklärt. Um gezielt die Faltungs- bzw. Entfaltungswege von Proteinen zu studieren werden diese ‘langgezogen’ um eine Entfaltung zu provozieren. Dadurch kann der Vorgang der Entfaltung gezielt analysiert und unter verschiedenen Vorraussetzungen getestet werden. Zu den bekanntesten Manipulationswerkzeugen gehören das AFM (Atomic Force Microscope), LOT (Laser Optical Tweezers / Optical Trap) und Magnetic Tweezers. Alternativen sind auch Micro-Needle Manipulation, BFM (Biomembrane Force Probe) und Flow-Induced Stretching [25, 48, 52]. Dabei gehören AFM und LOT zu den am häufigsten angewandten Methoden. Der Vollständigkeit wegen wird nun auf die Funktionsweise solcher Techniken am Beispiel des AFM eingegangen. Für einen intensiveren Einblick in die konkrete Anwendung der jeweiligen Technik und ihre Vorund Nachteile sei hier auf [4, 52, 55] und die darin enthaltenen Referenzen hingewiesen. Im weiteren Verlauf dieses Kapitels werden Zugexperimente vor dem Hintergrund von Computersimulationen betrachtet und anschließend beispielhaft am Trp-cage Molekül TC5b analysiert. 41 5. Zugexperimente Abbildung 5.1.: Simulation der Wanderung einer ssDNA durch eine Nanopore. Hier wird das stückweise Entfalten einzelner Abschnitte deutlich. Abbildung entnommen aus [16]. 5.1. Experimentelle Vorgehensweise Zugexperimente können beim heutigen Vorschungsstand im Vakuum oder in Lösung stattfinden, je nach Forschungszweck. Der Aufbau eines Zugexperiments besteht aus mehreren Grundbausteinen. Zunächst wird ein Ende des jeweiligen Moleküls an einer Oberfläche angebracht, durch Absorption oder Bildung einer kovalenten Bindung. Das andere Ende wird - in Abhängigkeit der Technik - mit verschiedenen Methoden an einer beweglichen Feder befestigt. Durch Ziehen in entgegengesetzter Richtung zur Oberfläche wird das Molekül einer externen Kraft ausgesetzt und dadurch zum Auseinanderfalten gezwungen. Die lokal auf das Molekül einwirkende Kraft wird mit Hilfe optischer Sensoren durch das Verbiegen der Feder gemessen. Solange die durch das Ziehen entstandene Kraft nicht ausreichend ist um die Energiebarriere des Zustands zu überwinden gibt die Feder nach und verbiegt sich. Das Verbiegen wird optisch gemessen und die Kraft, die auf das Molkül wirkt, wird daraus berechnet. Ist die auf das Molekül ausgeübte Kraft groß genug, entfaltet sich das Molekül stückweise und die Feder relaxiert. Die sich dadurch ergebenden Kraftkurven können Aufschluss auf den groben Aufbau des Moleküls und den Entfaltungsweg geben (siehe Abb. 5.2). Typische Ergebnisse bei Molekülen mit mehreren Faltungsdomänen haben die Form von sogenannten Sägezahn Mustern, die das Verbiegen und Relaxieren der Feder bei der Entfaltung der einzelnen Domänen wiederspiegeln. 42 5.1. Experimentelle Vorgehensweise Abbildung 5.2.: links: Aufbau einer AFM Messung, rechts: Darstellung von typischen Sägezahn-Ergebnissen. Entnommen aus [22] . 5.1.1. AFM in Zugexperimenten Wie schon in Kapitel 4.1 erwähnt bietet das AFM viele Möglichkeiten Biomoleküle zu analysieren. Nun beschäftigen wir uns mit einer weiteren bedeutsamen Anwendungsmethode des AFM: den Zugexperimenten. Hier gleitet die Spitze nicht über das Molekül, sondern wird fest mit einem Ende verbunden und zieht es von dem anderen Ende weg, wie in 5.1 beschrieben. Die Feder dient hier als Indiz für die Kraft die auf das Molekül wirkt. Ein beispielhafter Aufbau eines AFM mit Zugmodus ist in Abbildung 5.2 gegeben. Auf die Vorteile des AFM in Bezug auf Biomoleküle wurde schon vorher eingegangen. Dadurch wird ermöglicht die Entfaltungswege von größeren Biomolekülen zu studieren, auch unter annähernd physiologischen Bedingungen. Die daraus gewonnen Ergebnisse geben Aufschluss über die Vorgänge in biologischen Systemen. Für Anwendungen des AFM bei Zugexperimenten seien [22, 46, 55, 64] genannt. 5.1.2. Messziele und typische Ergebnisse Beim experimentellen Ziehen an biologischen Molekülen ist die Erforschung der Eigenschaften innerhalb biologischer Systeme besonders interessant. Durch die Auswahl der passenden Umgebung kann das Molekül seine native Konformation zeigen. Um bei Zugexperimenten eine möglichst natürliche Grundlage zu haben wird mit einer sehr weichen Feder mit minimaler Geschwindigkeit gezogen. Auf diesem Weg soll dem Molekül viel Freiraum zur Konformationsänderung gelassen und der Zwang zum Entfalten minimiert werden. Ziel ist es, einen reversiblen Prozess darzustellen, also die Entfaltung auf einem Wege herbeizurufen, der reversibel ist, wenn das Molekül relaxiert wird. 43 5. Zugexperimente Abbildung 5.3.: Kraft-Länge Kurven als Beispiel für ein nahezu reversibles (links) und ein irreversibles (rechts) Zugexperiment. Jeweils ist Ziehen (blau) und Relaxieren (grün) abgebildet, Abbildung entnommen aus [46]. Überprüfen kann man das anhand der force-extension-Kurven (Kraft-Länge Kurven), welche die Kraft auf das Molekül gegen die Länge angeben. Hier sollte die Kurve der Entfaltung mit der der Rückfaltung nach Möglichkeit übereinstimmen (siehe Abbildung 5.3). Die Analyse von Zugexperimenten unter diesem Aspekt kann man unter Anderem in [46, 64] nachlesen. Des Weiteren geben Kraft-Zeit Kurven einen möglichen Aufschluss auf die Anzahl der Entfaltungsdomänen. Die Idee ist, dass jeder ‘Sägezahn’ für die Aufspaltung einer Domäne steht (siehe Abbildung 5.2). Dabei wird angenommen, dass sich zuerst Regionen mit geringerer Bindungsstärke entfalten, was auch die ansteigende Höhe der Spitzen erklären könnte. Allerdings handelt es sich bei der Entfaltung von großen Biomolekülen um sehr komplexe Systeme und eine Verallgemeinerung von Aussagen über Entfaltungswege kann nicht getroffen werden. Eine genauere Betrachtung von Zugexperimenten unter diesem Gesichtspunkt ist in [22] beschrieben. Bei Zugexperimenten in Lösung sollte die mögliche Einwirkung des Lösungsmittels auf die Ergebnisse berücksichtigt werden. Durch die vorhandenen Moleküle wird der Zugvorgang ‘gebremst’ und eine Verzerrung der Ergebnisse kann entstehen. Um dies mit zu berücksichtigen wird bei Berechnungen ein Dämpfungskoeffizient eingeführt [21]. Ein weiterer Faktor ist die Zuggeschwindigkeit. Evans in [21] hat die Bindungsstärke im Zusammenhang mit Zuggeschwindigkeit und Federkonstante untersucht und herausgefunden, dass das Aufbrechen von Bindungen von diesen beiden Faktoren abhängen kann. Die Berücksichtigung vieler Faktoren ist somit essenziell um möglichst allgemeine Aussagen über Zugexperimente treffen zu können. 44 5.2. Zugexperimente durch MD Simulationen Abbildung 5.4.: Umsetzung eines Zugexperiments durch MD-Simulation, entnommen aus [25]. 5.2. Zugexperimente durch MD Simulationen Um die Vorgänge beim Entfalten genauer betrachten zu können wird derzeit vermehrt auf Computersimulationen zurückgegriffen. Durch quantitative Analysen können die Ergebnisse der Simulation auf Atomebene veranschaulicht, und so genauer untersucht werden. Zusätzlich beinhalten viele Simulationsprogramme weitere Analysemethoden, so dass anhand einer Simulation meist weitere Berechnungen stattfinden können. Heutzutage ist die Auswahl an Simulationsprogrammen breit gefächert und je nach Intention kann das passende Programm, häufig kostenfrei, gefunden werden. In vielen von ihnen sind auch Zugroutinen enthalten, um Zugexperimente zu simulieren. Dazu zählen etwa GROMACS, NAMD und TINKER [25]. Die Grundlage von Zugsimulationen ist eine MD-Simulation unter externer Kraft, welche ein Ende des Moleküls in eine frei wählbare Richtung zieht. Dazu werden die Koordinaten des einen Endes in ihrer Veränderbarkeit eingeschränkt, oder sogar eingefroren. Das andere Ende, an dem ‘gezogen’ werden soll, wird mit Hilfe eines harmonischen Potentials, welches die Feder darstellen soll, an einem Dummy Atom befestigt. Sei durch x die Position des zu ziehenden Endes bezüglich der Zugrichtung beschrieben. Ein harmonisches Potential, welches auf x wirkt, hat allgemein die Form k/2 (x−x0 )2 , wobei k die Federstärke, und x0 die Position des Dummy Atoms ist. Die Positionsänderung 45 5. Zugexperimente von x0 kann durch die Zuggeschwindigkeit und Richtung beeinflusst werden. Dieses Dummy Atom wird mit konstanter Geschwindigkeit in eine gewünschte Richtung bewegt, so dass durch das Potential eine Zugkraft auf das Molekül simuliert wird (siehe Abbildung 5.4) [25]. Auch andere Zugmöglichkeiten existieren neben dem Ziehen mit konstanter Geschwindigkeit, doch dieses entspricht am ehesten dem AFM-Experiment und wird daher in dieser Arbeit betrachtet werden. Trotz vieler Entwicklungen und Verbesserungen der letzten Jahre (siehe Kapitel 4.2) erreichen Simulationen noch nicht die Erforschungsvielfalt der experimentellen Zugversuche. Vor allem bei Macromolekülen übersteigt der Simulationsaufwand die heutigen technischen Möglichkeiten und viele experimentelle Beobachtungen können in Simulationen mit MD nicht erreicht werden. Dazu gehören auch Faltungs- bzw Entfaltungswege von großen Proteinen [18, 75]. Zusätzlich wird eine Simulation durch die Anzahl an Lösungsmittelmolekülen verlangsamt, da auch diese in jedem Iterationsschritt berechnet werden müssen, inklusive aller Kräfte. 5.2.1. Die Freie Energiedifferenz Die Limitationen einer Simulation liegen vor allem in der begrenzten Simulationszeit. Aufgrund dessen liegen die erreichbaren Zuggeschwindigkeiten vor allem bei großen Biomolekülen weit über denen aus Experimenten. Die Vorraussetzung eines reversiblen Prozesses ist deshalb häufig nicht gegeben. Ziel von Zug-Simulationen ist neben der genaueren Analyse des Entfaltungsvorgangs die Berechnung der Freien Energie bezüglich der untersuchten Reaktionskoordinate des Moleküls. Diese (Helmholtz-) Freie Energie, auch Potential of Mean Force (PMF) genannt, kann mit Hilfe des Umbrella Samplings [73] errechnet werden. Durch unendlich langsames Ziehen befände sich das System im Gleichgewicht, beschriebe also einen reversiblen Prozess, und die benötigte Arbeit entspräche der Freien Energie Differenz ∆F zwischen zwei Zuständen, durch W = ∆F . In der Praxis ist dies nicht möglich und die benötigte Arbeit übersteigt die Freie Energie Differenz. Besonders das relativ schnelle Ziehen in Simulationen führt zu großen Fehlern. Allerdings besagt die Jarzynski Gleichheit, dass die Freie Energie Differenz aus endlich vielen Ergebnissen im Nichtgleichgewicht berechnet werden kann R durch exp(−βW ) = ρ(W, ts )exp(−βW )dW = exp(−β∆F ) [31, 32]. Dabei beschreibt ρ(W, ts )dW die Wahrscheinlichkeit, dass die Arbeit, die für einen Übergang zweier Zustände, der in einer Zeit ts stattfindet, bei W bis W + dW liegt. Für ts → ∞ gilt W → ∆F , da ein Übergang in unendlicher Zeit einem Übergang im Gleichgewicht 46 5.2. Zugexperimente durch MD Simulationen Abbildung 5.5.: Wahrscheinlichkeitsdichten zu gegebenen Abständen, entnommen aus [25]. Wichtig für eine möglichst genaue Berechnung des PMF durch Umbrella Sampling ist der große Überlappungsanteil. entspricht. In Zugexperimenten wird die Berechnung des PMF häufig über das Umbrella Sampling mit Hilfe des WHAM-Algorithmus realisiert. Zunächst wird ein Zugexperiment mit steifer Feder simuliert. Die steife Feder ist dafür zuständig, dass in regelmäßigen Abständen Konformationen aus der Simulationen vorliegen. Zu daraus errechneten festen Abständen wird darauf aufbauend das Verhalten des Moleküls durch eine ausreichend lange MD-Simulation simuliert (Umbrella Sampling). Daraus werden zu den Abständen gehörende Wahrscheinlichkeitsdichten errechnet. Mit Hilfe des WHAMAlgorithmus [37] werden diese Wahrscheinlichkeiten gewichtet. Dafür muss die Vorraussetzung von ausreichend großen Überschneidungen der Dichten erfüllt sein. Ein Beispiel für Aufenthaltsdichten zu verschiedenen Abständen ist in Abbildung 5.5 gegeben. 5.2.2. GROMACS Bei den hier betrachteten Zugexperimenten wurde das Programm GROMACS [3, 28, 45, 77] in der Version 4.0 benutzt. Die Implementierung ist auf paralleles Rechnen ausgelegt und die hier verwendeten Simulationen dauerten etwas mehr als 24 Stunden, was verhältnismäßig kurz ist. Ein weiterer Vorteil ist die bereits vorhandene Routine für Umbrella-Zugexperimente, wie schon in Abschnitt 5.2 beschrieben. Für die explizite Anwendung und benutzte Analyseprogramme sei auf die Anleitung [76] verwiesen. 47 5. Zugexperimente In GROMACS ist eine große Auswahl an Kraftfeldern und Thermostaten enthalten, was vielseitige Simulationen ermöglicht. Zusätzlich existieren viele Routinen zur Ergebnisanalyse, inklusive graphischer Darstellung, und Daten können sofort verarbeitet werden. Auch können viele andere Programme (zum Beispiel VMD [29]) das Format von GROMACS lesen und verwenden. GROMACS ist Open Source und eigene Implementierungen können eingefügt werden. 5.3. Zugexperimente am TC5b Um ein Beispiel für Zugexperimente als Simulation zu geben wurde das in Kapitel 4.3 vorgestellte Miniprotein Trp-cage TC5b verwendet. In dieser Arbeit wurde ein besonders kleines Molekül ausgewählt, um die Simulationszeit gering zu halten. Damit viele parallele Simulationen zur Verbesserung der Statistik erzeugt werden können wurde das Vakuum als Simulationsumgebung gewählt. Durch das Fehlen der Moleküle des Lösungsmittels sind die Simulationen um ein Vielfaches schneller. Bevor eine MD-Simulation gestartet werden kann müssen einige Schritte zur Vorbereitung erfolgen, ähnlich eines Versuchaufbaus im Experiment. Der folgende Abschnitt beschreibt diese Vorgänge und ihre Bedeutung. Anschließend werden die Ergebnisse des Zugexperiments präsentiert und analysiert. Zuletzt wird in diesem Abschnitt eine Betrachtung der aufgetretenen Probleme vorgenommen. 5.3.1. Vorbereitung GROMACS kann mit den Strukturen aus der PDB-Datenbank arbeiten. In den folgenden Schritten wird der Anwendungsvorgang für die simulierten Zugexperimente beschrieben. Für genauere Informationen bezüglich GROMACS, seiner Vorgehensweise, anderer Varianten und genauer Formeln sei auf das Handbuch [28] verwiesen. Set-up Die Struktur des Trp-cage, gewonnen mit NMR, kann der PDB-Datenbank unter der Kennung 1L2Y entnommen und in GROMACS weiter verarbeitet werden. Dazu muss ein adäquates Kraftfeld ausgewählt werden. Kraftfelder bestimmen das Verhalten des 48 5.3. Zugexperimente am TC5b Moleküls, denn sie enthalten die Parameter, mit denen Bindungen, Winkel und Kräfte zwischen den Atomen berechnet werden, und folglich die Energie des Systems. So legen Kraftfelder beispielsweise für Atom-Atom Wechselwirkungen das Einwirken des Lennard-Jones Potentials plus Coulomb Wechselwirkungen fest durch Eab = XX i 12 6 qi qj e2 /rij + 4(σij12 /rij − σij6 /rij ) fij . j Das Kraftfeld beschreibt somit die Art, wie das Verhalten representiert wird. Eine Sammlung an Berechnungsformeln der einzelnen Kräfte ist in der Anleitung der jeweiligen GROMACS-Version zu finden [28]. Durch die geringe Größe des TC5b konnte ein All Atom Kraftfeld gewählt werden, was bedeutet, dass alle Atome inklusive Wasserstoff einbezogen werden. Die Wahl ist auf das OPLS-AA Kraftfeld gefallen (optimized potentials for liquid simulations - all atom). Es ist besonders für biologische Moleküle geeignet und wurde daraufhin ausreichend getestet [34, 35]. Für eine Simulation muss eine Umgebung definiert werden, in der die Simulation stattfinden soll. Dazu dient eine Box um das Molekül. In die Box wird Lösungsmittel gesetzt, hier nur ein Chlorid-Ion (Cl− ) als Ladungsausgleich, da das TC5b eine positive Ladung besitzt. Die Ränder der Box erfüllen periodische Randbedingungen zur Veringerung der finite-size Effekte und quasi-Erfüllung des thermodynamischen Limes. Für die folgenden Rechnungen werden langreichende elektrostatische Wechselwirkungen durch PME (particle-mesh Ewald [15]) beschrieben. Der cut-off für kurzreichende elektrostatische und van-der-Waals Wechselwirkungen liegt bei 1.0 nm. Zeitschrittweiten liegen bei 0.002 ps = 2 fs, und die Simulationsdauer hängt von der Intention der Simulation ab. Energieminimierung Nachdem alle Vorbereitungen getroffen sind müssen noch einige Schritte vor der eigentlichen MD-Simulation vorgenommen werden. Zuerst wird eine Energieminimierung durchgeführt, bis die größte Kraft kleiner als 500 kJ/mol·nm ist. Energieminimierung ist notwendig um das System zu relaxieren. Die Energielandschaft von biologischen Molekülen ist sehr komplex. Sie besteht aus einem globalen, sehr tiefen Minimum und vielen lokalen Minima. Die Energieminimierung soll das nächstgelegene Minimum erreichen. Mögliche Vorgänge sind Steepest Decent oder Conjugate Gradient. Hier wurde die Steepest Decent Methode gewählt, mit dem Abbruchkriterium, dass die größte 49 5. Zugexperimente Abbildung 5.6.: Potentielle Energie der Energieminimierung Kraft einen Wert kleiner als 500 kJ/mol·nm erreichen soll. Steepest Decent bedeutet, dass in jedem Schritt die Richtung der größten negativen Steigung als Bewegungsrichtung gewählt wird, unabhängig von vorherigen Schritten. Sie ist einfach und schnell, garantiert aber nicht genau im Miminum zu landen, sondern nur in seiner Umgebung. Sie sorgt somit dafür, dass die Kräfte, die das Molkül beschreiben, zu Beginn der eigentlichen Simulation möglichst minimal sind. Eine Darstellung der Gesamtenergie während der Minimierung des Trp-cage ist in Abbildung 5.6 gegeben. Equilibrierung Die Simulationen sollen bei 300 K stattfinden. Dazu muss das System bei konstantem Volumen auf diese Temperatur equilibriert werden. Die sogenannte NVT (Konstante Teilchenzahl N, Volumen V und Temperatur T) -Equilibrierung wurde für 100 ps simuliert, um die Temperatur auf der gewünschten Höhe zu halten. Dieses Zusammenspiel von N, V und T nennt man auch kanonisches Ensemble [53]. Es soll garantieren, dass unter fester Teilchenzahl und Volumen die Temperatur während der Simulation nur geringen Schwankungen unterliegt. Während der Equilibrierungsphase werden die schweren Atome des Moleküls fixiert, sodass sie nur unter großem Energieaufwand ihre Konfiguration ändern können. Das dient dazu, dass sich das Lösungsmittel und die leichteren Atome im Gleichgewicht befinden. Die Geschwindigkeiten werden aus einer Maxwell-Verteilung mit Temperatur 300 K gewonnen. Um die Temperatur stabil zu halten ist ein Thermostat nötig, denn durch die Berechnung neuer Geschwindigkeiten ändert sich die kinetische Energie 50 5.3. Zugexperimente am TC5b und dadurch die Temperatur (Äquipartitionstheorem). Thermostate regulieren diese Änderung auf unterschiedliche Weisen. Hier fiel die Wahl auf das Velocity-rescale Thermostat von Bussi et al. [11]. Die Idee des Thermostats ist folgende: In regelmäßigen Abständen werden die Geschwindigkeiten so skaliert, dass die kinetische Energie der durchschnittlichen Energie zur Temperatur T (hier 300 K) entspricht. Als Relaxationszeit wurde hier der Parameter τ = 0.1 gewählt. Die Umsetzung des Thermostats ist [11] zu entnehmen. MD-Simulation Da in den vorangegangenen Schritten position restraints, also Fixierungen der Atome, benutzt wurden wird noch eine kurze MD-Simulation ohne position restraints gestartet. Ziel ist es, dass sich das Molekül in der Umgebung in einen favorisierten Zustand begibt, von dem aus Zugexperimente gestartet werden können. Die MD-Simulation soll bei 300 K für 100 ps stattfinden. Um dies zu gewährleisten wurde wieder das V-Rescale Thermostat genutzt. Bei Betrachtung der potentiellen Energie wird deutlich, dass ein weitaus günstigerer Zustand gefunden werden konnte und dieser recht stabil zu sein scheint. Ähnliche Ergebnisse wurden auch bei längeren MD-Simulationen von 1 ns und 10 ns festgestellt (siehe Abbildungen im Anhang A.1). Eine genauere Analyse der Konfiguration zeigt die Bildung einer Wasserstoffbrückenbindung zwischen den beiden End-Residuen ( Abbildungen 5.7(a) und 5.7(b)). 5.3.2. Zug-Simulationen Die aus der MD-Simulation gewonnene Struktur dient als Startkonfiguration für alle Zugexperimente, um Vergleiche ziehen zu können. Als Referenzende dient das Residuum 1 (die Seite der α-Helix). Gezogen wird an Residuum 20, also dem anderen Ende des Moleküls. Für das Thermostat wurde wieder V-Rescale gewählt. Der theoretische Vorgang in Zugsimulationen wurde bereits in Abschnitt 5.2 behandelt. Hier sollen nun die Eigenschaften unter verschiedenen Vorraussetzungen von Federkonstante und Geschwindigkeit untersucht werden. Simulationen wurden für Zuggeschwindigkeiten von 0.001, 0.002, 0.005 und 0.01 nm/ps bei Federstärken von 250, 300, 400, 500, 600, 750 und 1000 kJ/mol·nm2 gestartet. Die Simulationsdauer wurde mit dem Ziel gesetzt, den ersten 51 5. Zugexperimente (a) Startkonfiguration (b) Konfiguration nach MD Abbildung 5.7.: Konfigurationen vor- und nach der MD-Simulation. Die entstandene Bindung ist deutlich oben im Bild erkennbar. Konfigurationswechsel abbilden zu können. Dieser variiert für unterschiedliche Federkonstanten zwischen 2 und 4 ns. Bei den Zuggeschwindigkeiten ergab sich dadurch eine Simulationsdauer von 200 bis 4000 ps bei Zeitschritten von 0.002 ps, die bei parallelem Rechnen maximal 24 Stunden knapp überschritten. Gezogen wurde als Center Of Mass (COM), also der gemittelte Schwerpunkt des Residuums. Die Richtung wurde als die direkte Verbindung der beiden End-Residuen gewählt. GROMACS bietet weitere Möglichkeiteen für Zugexperimente. So kann zum Beispiel ein beliebiger Vektor als Zugrichtung angegeben werden. Auch das Ziehen mehrerer Residuen ist möglich. Diese Varianten wurden aber nicht weiter untersucht, da sie nicht das AFM-Ziehen wiederspiegeln. 5.3.3. Ergebnisse Die gewählten Parameter der Federkonstanten sollen weiche - bei kleinen Werten bis harte Federn repräsentieren. Auch die Geschwindigkeiten sind so gewählt, dass ein Unterschied zwischen langsamem und schnellem Ziehen untersucht werden kann. Zunächst wird allgemein der Konfigurationswechsel analysiert. Anschließend werden die Veränderungen durch verschiedene Parameter betrachtet. 52 5.3. Zugexperimente am TC5b (a) Kurz vor dem Peak (b) Nach dem Sprung ist die Fe- (c) Typische Kraftkurve bei den der wieder relaxiert Zugexperimenten Abbildung 5.8.: Zeitpunkt vor (a), und nach (b) dem Aufspalten. Die Anspannng der Feder und plötzliche Relaxion ist in c) deutlich erkennbar. Der Sprung Die Kraft-Zeit Kurven zeigen deutlich das Auftreten eines großen Peak. Genauer betrachtet bedeutet dies, dass bis dorthin die durch das Ziehen entstandene Kraft nicht ausreichend war um das Molekül aus seinem Zustand zu holen. An der Stelle des Peaks übersteigt die Kraft die Energiebarriere und das Molekül sollte dann eine neue lokal- minimalenergetische Konfiguration annehmen. In Abbildung 5.8 ist eine beispielhafte Kraft-Zeit Kurve aufgetragen und die entsprechende graphische Darstellung mit VMD [29] hinzugefügt. Es wird deutlich, dass der Übergang das Entfalten des Moleküls darstellt. Bei einzelner Betrachtung wird erkennbar, dass der Sprung an der Stelle der Aufspaltung der in der MD-Simulation entstandenen Bindung stattfindet. Nun soll analysiert werden, welchen Einfluss die Federkonstante und Zuggeschwindigkeit auf den Entfaltungsvorgang haben. Zu erwarten ist, dass bei steifen Federstärken und zu schnellem Ziehen eine deutliche Hysterese zu beobachten ist, also ein unterschiedliches Verhalten für Faltung und Relaxation. Parametereinfluss Die Kraft-Zeit Kurve zu unterschiedlichen Federkonstanten wurde für gleiche Zuggeschwindigkeiten in Abbildung 5.9 verglichen. Zum einen bestätigen die Abbildungen die Hypothese, dass für eine weichere Feder der Zugweg durch das erweiterte Nachgeben der Feder länger ist [48]. Zum anderen zeigen sich starke Irregularitäten was die Größe der benötigten Kraft angeht. Analoge Aufzeichnungen von Vergleichen von 53 5. Zugexperimente (a) Zuggeschwindigkeit v=0.001 nm/ps (b) Zuggeschwindigkeit v=0.002 (c) Zuggeschwindigkeit v=0.005 nm/ps (d) Zuggeschwindigkeit v=0.01 nm/ps nm/ps Abbildung 5.9.: Kraft-Zeit Kurven bei konstanter Zuggeschwindigkeit v und variierenden Federstärken k. unterschiedlichen Zuggeschwindigkeiten zu gleicher Federkonstante verdeutlichen diese Beobachtung (siehe Abbildung 5.10). Zur Verdeutlichung werden im Folgenden die Ergebnisse aus Abbildung 5.9 normiert und in Abbildung 5.11 dargestellt. Auch hier ist zu beobachten, dass die Dauer bis zum Aufspalten nicht deutlich von den Parametern abhängig ist. Vor allem bei schnellem Ziehen sind bei den Kurven der steifen Federn die ‘Reihenfolgen’ der Kurven nicht entsprechend der Steifheit. Verdeutlicht wird dies in den Kraft-Länge Kurven (forceextension) in Abbildung 5.12. Hier wird die Kraft gegen den End-zu-End Abstand aufgetragen. Die analogen Abbildungen bei konstanten Federstärken mit verschiedenen Geschwindigkeiten für die Kraft-Zeit, sowie die Kraft-Längen Kurven sind im Anhang unter A zu finden . Um genauere Ursachen für dieses Phänomen zu finden muss eine weitere Analyse der Simulationen und ihrer Eigenschaften erfolgen. 54 5.3. Zugexperimente am TC5b (a) Federstärke k=250 kJ/mol·nm2 (b) Federstärke k=300 kJ/mol·nm2 (c) Federstärke k=400 kJ/mol·nm2 (d) Federstärke k=500 kJ/mol·nm2 (e) Federstärke k=600 kJ/mol·nm2 (f) Federstärke k=750 kJ/mol·nm2 Abbildung 5.10.: Kraft-Zeit Kurven bei konstanter Federstärke k und variierenden Zuggeschwindigkeiten v. 55 5. Zugexperimente (a) Zuggeschwindigkeit v=0.001 nm/ps (b) Zuggeschwindigkeit v=0.002 (c) Zuggeschwindigkeit v=0.005 nm/ps (d) Zuggeschwindigkeit v=0.01 nm/ps nm/ps Abbildung 5.11.: Normierte Kraft-Zeit Kurven bei konstanter Zuggeschwindigkeit v und variierenden Federstärken k, siehe Abbildung 5.9. Probleme im Vakuum Eine genauere Analyse des Entfaltungsvorganges zeigt ein Problem, das auf die Simulation im Vakuum zurückzuführen ist. Die Beobachtungen zeigen große Fluktuationen während der Simulationen. Aufgrund der Nichteingeschränktheit durch das Fehlen polarer Lösungsmittel existiert im Vakuum ein größerer Freiraum für Bewegungen. Dies kann ein Grund für die teilweise recht unterschiedlichen Maxima der Kraftkurven sein. In Abbildung 5.13(a) sind fünf Simulationen unter den gleichen Vorraussetzungen gestartet worden. Die Höhe der Peaks variiert signifikant, was diese These unterstützt. In Abbildung 5.13(b) tritt noch ein weiteres Phänomen auf, das durch das Fehlen eines Lösungsmittels entsteht. Häufig werden biologische Moleküle durch ihre Umge- 56 5.3. Zugexperimente am TC5b (a) Zuggeschwindigkeit v=0.001 nm/ps (b) Zuggeschwindigkeit v=0.002 (c) Zuggeschwindigkeit v=0.005 nm/ps (d) Zuggeschwindigkeit v=0.01 nm/ps nm/ps Abbildung 5.12.: Normierte Kraft-Abstand Kurven bei festen Zuggeschwindigkeiten v. bung stabilisiert. Durch das Fehlen einer stabilisierenden Umgebung existieren gewisse Kräfte nicht, die durch polare Lösungsmittel entstehen. Die Struktur des TC5b wird durch hydrophobe (Wasser-vermeidende) -Effekte unterstützt [51]. Der Hydrophobe Effekt tritt bei unpolaren Molekülen in wässrigen Lösungen auf und basiert darauf, dass das unpolare Molekül dem Wasser möglichst wenig Oberfläche bieten möchte. Studien zeigen, dass die Proteinfaltung unter anderem auf diesen Effekt zurückzuführen ist (siehe z.B. [72]). Eine Zusammenfassung der Erkenntnisse zu diesem Thema ist in [1,2] gegeben. Ein allgemeiner Überblick über den Hydrophoben Effekt ist in [8] zu finden. Das in Abbildung 5.13(b) angedeutete Problem, resultierend aus dem Fehlen eines Lösungsmittels, kann anschaulich erläutert werden. Offensichtlich kommt es zum frühzeitigen Entspannen der Feder, aber keiner anschließenden Relaxierung in lokale Minima. Dieses Phänomen tritt verstärkt bei schnelleren Zuggeschwindigkeiten, vor 57 5. Zugexperimente (a) fünf Simulationen mit k=250 kJ/nm/mol2 (b) fünf Simulationen mit k=750 kJ/nm/mol2 Abbildung 5.13.: Je fünf Simulationen unter den gleichen Vorraussetzungen können zu sehr unterschiedlichen Ergebnisse führen, hier ist v=0.001 nm/ps allem aber bei steifen Federn auf. Bei einer genaueren Betrachtung des Sprungzeitraumes ist erkennbar, dass statt eines ruckartigen Aufspaltens der Bindung aus Schritt 5.3.1 zusätzlich eine teilweise Entfaltung der α-Helix stattfindet. Daraus resultierend verliert das Molekül seine Stabilität und entfaltet sich unter Verlust der α-Helix. Durch die Instabilität ist ein verändertes Verhalten in der Kraft-Zeit Kurve zu beobachten. Ein beispielhafter Ablauf ist in den Abbildungen 5.14 gegeben. Gezeigt wird die Simulation, welche der grünen Kurve aus Abbildung 5.13(b) entspricht. Daraus resultierend sollte für weitere Rechnungen ein geeignetes Lösungsmittel gefunden werden. Dies wird allerdings die Simulationszeit deutlich vergrößern, was der ursprüngliche Grund für die Vakuumsimulationen war. Daraus resultierende Problematik Das Auftreten von Entfaltungen nach dem Schema aus Abbildung 5.14 tritt vermehrt bei schnellem Ziehen auf, hauptsächlich aber bei der Anwendung steifer Federn. Die letzten brauchbaren Werte liegen für Federn mit 1000 kJ/mol vor. Weitere Rechnungen mit Federn ab 3000 kJ/mol lieferten keine typisch geformten Kraftkurven. Zum Einen sind Vergleiche zwischen Simulationen unter den selben Bedingugen erschwert, da die Menge der sinnvollen Werte sehr gering ausfallen kann. Auf der anderen Seite sind Rechnungen unter steifer Feder gar nicht möglich, da sämtliche Rechnungen unbrauchbar sind. 58 5.3. Zugexperimente am TC5b (a) t=698 ps (b) t=705 ps (c) t=1465 ps (d) t=1749 ps Abbildung 5.14.: Ablauf einer Entfaltung, fehlerhaft durch Fehlen eines stabilisierenden Lösungsmittels. Die daraus resultierende Problematik liegt in der Errechnung des PMF aus Abschnitt 5.2.1. Für den WHAM-Algorithmus müssen für verschiedene Abstände gut überlappende Dichtekurven vorliegen. Mit weicher Feder ist der Sprung im Abstand zu groß (siehe Abbildung 5.15(a)) und der Bereich kann nicht ausreichend genug abgebildet werden. Ein anderes Problem ist die generelle Simulation im Vakuum. Eine MD-Rechnung bei 300 K für 10 ns ergab keine Veränderung des Proteins. Doch bei höher temperierten Simulationen von 400 K und 500 K zeigt sich eine Konfiguarionsänderung innerhalb weniger Nanosekunden (vgl. Abbildung 5.15(b)). Statt einer Vergrößerung des End-zuEnd Abstandes, wie durch eine Zugkraft simuliert, verändern sich die α-Helix und die 310 -Helix. Die weitere Analyse und der Vergleich mit Lösungsmittelresultaten stehen jedoch nicht im Zusammenhang mit den Zugexperimenten und sind nicht mehr Ziel dieser Arbeit. Insgesamt lässt sich aus den Vakuum-Simulationen die Konsequenz ziehen, dass andere typische Berechnungen bezüglich Biomolekülen, vor allem der freien Energielandschaft, unter diesen Vorraussetzungen möglich sind, aber ein Vergleich zu 59 5. Zugexperimente (a) Abstandsfunktion bei k=1000 kJ/mol (b) Simulation bei 500 K Abbildung 5.15.: a) Abstandsfunktion der beiden Endresiduen einer Zugsimulation, b) Entstandene Konfiguratione einer MD-Simulation bei 500 K. den Zuständen im Lösungsmittel deutliche Unterschiede aufzeigt. 5.3.4. Vergleiche mit dem Modell Rückblickend auf das Modell aus Kapitel 3 zeigen sich viele Parallelen in den Ergebnissen. Zum einen kann eine Reduktion der Simulationszeit bei schnellerer Zuggeschwindigkeit gezeigt werden. Andererseits ist eine gute Übereinstimmung der Form der Kraft-Zeit Kurven und der Kraft-Abstand Kurven für weiche Federn zu beobachten. In beiden Fällen ist ein deutlicher Sprung der Kurven nach der Überwindung der Energiebarriere sichtbar. Durch die Möglichkeit der Fluktuation durch den Zufallsterm variiert die Höhe der Kraftkurven auch im Modell signifikant und deutlicher als in den Protein-Simulationen. Die anderen Kraftkurven bei verändertem Entfaltungsweg sind im Modell nicht darstellbar. Alternativ könnte ein anderes Potential betrachtet werden, dass einen metastabilen Zustand zulässt, und daraufhin untersucht werden kann. Allgemein lässt sich sagen, dass trotz der starken Vereinfachung des Modells grundlegende Eigenschaften aus Simulationen nachweisbar sind. 60 5.4. Weitere Möglichkeiten 5.4. Weitere Möglichkeiten Ein großes aktuelles Forschungsgebiet bezüglich Proteinfaltung sind freie Energielandschaften. Sind diese für ein biologisches Molekül bekannt kann sein Verhalten vorausgesagt werden, da sämtliche lokale Minima und das globale Minimum sowie die Energiebarrieren für die Übergänge bekannt sind. Bei biologischen Molekülen handelt es sich um sehr komplexe Systeme, die von mehreren tausend Freiheitsgraden abhängen. Aktuelle Ansätze befassen sich damit, die Beschreibung des Systems auf einige wenige, sogenannte ‘kollektive’, Variablen zu beschränken. Solche Variablen können der Gyrationsradius, Torsionswinkel oder die ersten Eigenwerte einer PCA (principal component analysis) sein. Diese werden auch Fortschrittsvariablen genannt, denn durch sie soll der Reaktionsweg von Übergängen genügend genau dargestellt werden können. In [17, 56] konnten gute Ergebnisse durch diese Vereinfachung erzielt werden. Doch die starke Reduzierung der Reaktionsbeschreibung kann nicht alle Komplexitäten des Systems aufzeigen und kann somit zum Verlust wichtiger Informationen führen [69]. Zusätzlich ist in manchen Systemen die Wahl dieser Variablen nicht einfach. Zur freien Energieberechnung gibt es unterschiedliche Herangehensweisen. Ziel ist es, die Energielandschaft zu erkunden, was durch einfache MD-Simulationen wegen der begrenzten Simulationszeit nicht möglich ist. Das Umbrella-Sampling wurde hier gewählt, weil es auf Zugexperimente angewandt werden kann. Andere Varianten zur Erforschung der Energielandschaft sind Parallel Tempering bzw. Replica Exchange oder Metadynamik. Parallel Tempering [19] basiert auf der Idee die gesamte Landschaft zu erhalten, in dem bei verschiedenen Temperaturen simuliert wird, und regelmäßig Teile des Systems nach bestimmten Wahrscheinlichkeitsregeln vertauscht werden. Dadurch können die sonst in lokalen Minima ‘gefangenen’ Niedrigtemperatursimulationen beschleunigt werden. In Metadynamik-Rechnungen [38,39] werden die Minima mit potentieller Energie ‘aufgefüllt’, bis der Übergang zu einem neuen Minimum stattfindet. Die zugeführte Energie gibt Aufschluss über die Barrierehöhe, bzw die ‘Tiefe’ des Minimums. Durch diese Methodik können die Zustände in simulierbaren Zeitenskalen berechnet werden. Zusätzlich gibt es viel Erweiterungen und Verbesserungen von Algorithmen und Vorgehensweisen (Beispielhaft für Metadynamik in [68]). Andere Ansätze befassen sich mit der Verbesserung der Berechnungen von Eigenvektoren durch LSD-Maps (Locally Scaled Diffusion-Maps) [66, 79]. Ziel ist es, mit wenigen kollektiven Variablen die Energielandschaft genügend gut und in möglichst kurzer Zeit zu berechnen. 61 6. Zusammenfassung und Ausblick In dieser Arbeit wurden die Grundlagen von Zugsimulationen an biologischen Molekülen untersucht und an einfachen Beispielen exemplarisch dargestellt. Dafür wurden zunächst ein vereinfachtes Modell betrachtet und anschließend Zugsimulationen mit dem Trp-cage Protein TC5b ausgewertet. Im ersten Teil wurde die Theorie hinter Zugsimulationen durch die Fokker-Planck Gleichung betrachtet. Dafür wurde die Herleitung der Fokker-Planck Gleichung über den Ansatz der Mastergleichung gegeben. Anschließend wurde eine alternative Herleitung über ein Teilchen unter Brownscher Dynamik betrachtet um die Gleichungen und Parameter für die anschließenden Simulationen zu erhalten. Darauf aufbauend wurde ein einfaches Modell für ein Teilchen mit Brownscher Bewegung in einem Potential betrachtet und auf seine Anwendbarkeit überprüft. Das Modell wurde anschließend um eine Zugkraft erweitert und seine Eigenschaften bezüglich der Zuggeschwindigkeit und Federstärke analysiert. Es konnte gezeigt werden, dass die Zuggeschwindigkeit einen erheblichen Einfluss auf die Simulationszeit hat. Die Bedeutung der Federstärke der Zugkraft konnte dabei mit der Fluktuationsrate in Verbindung gebracht werden. Weiter war es möglich typische Kraft Kurven analog zu experimentellen und simulierten Zugexperimenten aus der Literatur zu erhalten. Für den Vergleich mit Zugexperimenten an Biomolekülen wurde daraufhin eine Einführung in Biomoleküle und ihre Erforschung gegeben. Anschließend wurden experimentelle Zugexperimente beschrieben und am Beispiel des AFM erläutert. Danach folgte eine Einführung in Computersimulationen. Vor diesem Hintergrund wurde anschließend beispielhaft das Trp-cage Miniprotein TC5b unter verschiedenen Zuggeschwindigkeiten und Federkonstanten im Vakuum simuliert. Durch die Wahl des Vakuums als Simulationsumgebung zur Vereinfachung des Systems konnten die Ergebnisse nicht in Bezug zum tatsächlichen Verhalten des Proteins in physiologischer Umgebung gebracht werden. Allerdings zeigten sich viele Übereinstimmungen mit den Ergebnissen aus der Modellbetrachtung. Zum einen konnte der Einfluss der Geschwindigkeit auf die Simulationslänge analog zum Modell beobachtet werden. Andererseits war es auch möglich vergleichbare Kraft Kurven bei weicher Feder zu erhalten. 63 6. Zusammenfassung und Ausblick Diese Arbeit hat eine Grundlage für weitere Simulationen geschaffen. Das Modell aus Kapitel 3 liefert eine gute Ausgangsposition um die Grundlagen von Zugexperimenten zu analysieren. Sowohl die Zeitsteuerung durch die Schrittanzahl als auch das Verhalten an der Energiebarriere können für weitere Fälle analysiert werden. Die Kraft-Zeit und Kraft-Abstand Kurven liefern ein gutes Verständnis für den Bewegungsablauf. Andere Energielandschaften können somit auf dieses Modell angewandt und dadurch analysiert werden. Die Erweiterung für den Fall ohne große Reibung und den dadurch entstehenden Geschwindigkeitsterm sollte erweiterte Simulationen ermöglichen. Die Umsetzung könnte durch den Leap-Frog Algorithmus modelliert werden. Eine Fortsetzung der Untersuchungen wäre an dieser Stelle gut möglich. Aufbauend auf den Zugexperimenten am Trp-cage Protein in Kapitel 5 können Simulationen in Wasser oder impliziten Lösungsmitteln folgen. Die Vorgehensweise ist in den meisten Teilen analog zu Vakuumsimulationen. Hinzu kommt neben dem Lösungsmittel eine NPT-Equilibrierung folgend auf die NVT-Equilibrierung zur Kontrolle des Drucks. Des Weiteren ist ein Ausbau bezüglich der Errechnung der Energielandschaft für Simulationen mit Lösungsmittel denkbar. Die Ansätze dafür wurden in Abschnitt 5.4 behandelt und können in GROMACS und seinen Erweiterungen simuliert werden. Das Trp-cage bietet durch seine geringe Größe die Möglichkeiten solcher Simulationen in vergleichbar kurzer Zeit. Ein Ausbau auf andere Miniproteine ist auch denkbar. Die gegebenenfalls ansteigende Simulationszeit sollte bei der Wahl des neuen Proteins berücksichtigt werden. 64 A. Ergänzende Abbildungen (a) Simulationszeit 1 ns (b) Simulationszeit 10 ns Abbildung A.1.: Potentielle Energie von MD-Simulationen bei 300 K. 65 A. Ergänzende Abbildungen (a) k=250 kJ/mol·nm (b) k=300 kJ/mol·nm (c) k=400 kJ/mol·nm (d) k=500 kJ/mol·nm Abbildung A.2.: Normierte Kraft-Abstand Kurven für verschiedene Federkonstanten k. 66 (a) k=250 kJ/mol·nm2 (b) k=300 kJ/mol·nm2 (c) k=400 kJ/mol·nm2 (d) k=500 kJ/mol·nm2 (e) k=600 kJ/mol·nm2 (f) k=750 kJ/mol·nm2 Abbildung A.3.: Normierte Kraft-Zeit Kurven zu unterschiedlichen Zuggeschwindigkeitenv bei fester Federkonstante k. 67 B. C++-Programmübersicht Für die Implementierung des Modells aus Kapitel 3 in C++ wurden drei Programme geschrieben, die hier zur Übersicht zusammengefasst werden. In der Datei main 1D.cc ist die gesamte Implementierung der Freien Energierechnung für den 1D-Fall zu finden. Hier befindet sich die main-Funktion sowie die Routinen zur Berechnung des Potentials, der Potentialkraft, des Zufallterms und der Bestimmung des maximalen Wertes eines Arrays und des zugehörigen Indexes. Die Datei main rate.cc enthält das Programm für die Übergangsraten bei verschiedenen Temperaturen. Der Aufbau ist sonst identisch zu main 1D.cc. In der Datei main 2D.cc ist die main-Funktion für das 2D-Problem implementiert. Die Werte für die Zugkraft und Federkonstante können bei der Programmausführung übergeben werden. Neben der Deklaration der wichtigsten Parameter finden sich hier drei Routinen, die je nach Ziel der Simulation gewählt werden können. Diese sind energylandscape(), jumpoverbarrier() und pullforce(). In der Routine energylandscape() ist die Freie Energie-Rechnung implementiert, wobei über mehrere Durchläufe gemittelt wird. Die Berechnung der Freien Energie und ihre Ausgabe erfolgt durch die Routine calc force(). Mit jumpoverbarrier() wird das Verhalten bis zum Erreichen der Energiebarriere unter einer Zugkraft untersucht. Auch hier wird über mehrere Simulationen gemittelt. Die Auswertung und Ausgabe der Ergebnisse erfolgt durch analysis(). Der Aufruf der Funktion befindet sich in einer Schleife, um das Verhalten bei steigender Federkonstante darstellen zu können. Die Routine pullforce() lässt die Bewegung eines Teilchens bis zur Erreichung einer Minimumsumgebung mit Zugkraft simulieren und gibt die Parameter für Zeit, Abstand zum Ursprung und Kraft aus. Im Folgenden ist eine Auflistung der Dateien und ihre enthaltenen Routinen gegeben. • main 1D.cc: Alle Routinen für die 1D-Simulation der Freien Energieberechnung • main rate.cc: Alle Routinen für die 1D-Simulation mit Ratenbestimmung 69 B. C++-Programmübersicht • main 2D.cc: main() für alle Simulationen im 2D-Fall • header.hh: Header-Dateien aus der Standardbibliothek • energylandscape.hh: energylandscape() • jumpoverbarrier.hh: jumpoverbarrier() • pullforce.hh: pullforce() • potential.hh: – potential(): Ausgabe des Potentials für beliebige Werte – x direction(): Ableitung des Potentials nach x – y direction(): Ableitung des Potentials nach y • force.hh: calc force(): Berechnung und Ausgabe der Freien Energie-Rechnung • pulling.hh: pulling(): Berechnung der Zugkraft • analysis.hh: analysis(): Berechnung und Ausgabe des Mittelwertes und Standardabweichung des Übergangsortes und der benötigten Schrittzahl • position.hh: – position(): weist der Position eine Gitterzelle zu – con index(): Umwandlung der Indexnummer auf Stelle der x-Achse – maximum(): Gibt den Index des größten Wertes eines Arrays zurück – jump(): gibt false wenn die y-Achse überschritten wird – well(): gibt true wenn Teilchen im Minimum ist 70 Abbildungsverzeichnis 3.1. Freie Energieberechnung im harmonischen Potential . . . . . . . . . . . 23 3.2. Freie Energieberechnung im Doppelmuldenpotential . . . . . . . . . . . 25 3.3. Arrhenius-Plots der Übergangsraten . . . . . . . . . . . . . . . . . . . . 26 3.4. Darstellung des Potentials. . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.5. Kraft-Zeit Kurven für das Ziehen mit Geschwindigkeit v = 0.2. . . . . . 29 3.6. Abhängigkeit der Schrittzahl von der Federkonstanten. . . . . . . . . . 30 3.7. Abhängigkeit des Übergangsortes von der Federkonstanten. . . . . . . . 31 3.8. Kraft-Abstand Kurve für v = 0.2 und k = 1. . . . . . . . . . . . . . . . 32 3.9. Kraft Kurven für das Ziehen mit Geschwindigkeit v = 0.2. . . . . . . . 33 3.10. Kraft Kurven für k = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4.1. Aufbau eines AFM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.2. Trp-cage Miniprotein TC5b . . . . . . . . . . . . . . . . . . . . . . . . 39 5.1. Wanderung durch Nanopore . . . . . . . . . . . . . . . . . . . . . . . . 42 5.2. AFM Messgerät und typische Ergebnisse . . . . . . . . . . . . . . . . . 43 5.3. Beispielhafte Kraft-Länge Kurven . . . . . . . . . . . . . . . . . . . . . 44 5.4. Umsetzung eines Zugexperiments durch MD-Simulation . . . . . . . . . 45 5.5. Wahrscheinlichkeitsdichten für den WHAM-Algorithmus . . . . . . . . 47 5.6. Potentielle Energie der Energieminimierung . . . . . . . . . . . . . . . 50 5.7. Konfigurationen vor- und nach der MD-Simulation . . . . . . . . . . . 52 5.8. Analyse des Aufspaltens . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.9. Kraft-Zeit Kurven, konstantes v . . . . . . . . . . . . . . . . . . . . . . 54 5.10. Kraft-Zeit Kurven, konstantes k . . . . . . . . . . . . . . . . . . . . . . 55 5.11. Normierte Kraft-Zeit Kurven, konstantes v . . . . . . . . . . . . . . . . 56 5.12. Normierte Kraft-Abstand Kurven, konstantes v . . . . . . . . . . . . . 57 5.13. Probleme bei den Simulationen . . . . . . . . . . . . . . . . . . . . . . 58 5.14. Abweichungen bei der Entfaltung . . . . . . . . . . . . . . . . . . . . . 59 5.15. Analyse der Problematik . . . . . . . . . . . . . . . . . . . . . . . . . . 60 71 Abbildungsverzeichnis A.1. Potentielle Energie von MD-Simulationen bei 300 K. . . . . . . . . . . A.2. Normierte Kraft-Abstandkurven, konstantes k . . . . . . . . . . . . . . A.3. Normierte Kraft-Zeit Kurven, konstantes k . . . . . . . . . . . . . . . . 72 65 66 67 Literaturverzeichnis [1] Robert L. Baldwin. Energetics of Protein Folding. Journal of Molecular Biology, 371(2):283–301, 2007. 57 [2] Robert L. Baldwin. Weak Interactions in Protein Folding: Hydrophobic Free Energy, van der Waals Interactions, Peptide Hydrogen Bonds, and Peptide Solvation, pages 127–162. Wiley-VCH Verlag GmbH, 2008. 57 [3] H.J.C. Berendsen, D. van der Spoel, and R. van Drunen. GROMACS: A messagepassing parallel molecular dynamics implementation. Computer Physics Communications, 91(1–3):43–56, 1995. 47 [4] G. Binnig, C. F. Quate, and Ch. Gerber. Atomic Force Microscopy. Phys. Rev. Lett., 56:930–933, Mar 1986. 35, 36, 37, 41 [5] G. Binnig and H. Rohrer. Scanning Tunneling Microscopy. Helvetica Physica Acta, 55:726–735, 1982. 36 [6] G. Binnig and H. Rohrer. Scanning tunneling microscopy. Surface Science, 152– 153, Part 1(0):17–26, 1985. 36 [7] Gerd Binnig and Heinrich Rohrer. Scanning Tunneling Microscopy—from Birth to Adolescence (Nobel Lecture). Angewandte Chemie International Edition in English, 26(7):606–614, 1987. 36 [8] Wilfried Blokzijl and Jan B. F. N. Engberts. Hydrophobic Effects. Opinions and Facts. Angewandte Chemie International Edition in English, 32(11):1545–1579, 1993. 57 [9] A. Boulkhemair and A. Chakib. On the Uniform Poincaré Inequality. Communications in Partial Differential Equations, 32(9):1439–1447, 2007. 17 73 Literaturverzeichnis [10] Martin Burger. Skriptum zur Vorlesung Mathematische Modellierung, WS 12/13. WWU Münster. 15 [11] Giovanni Bussi, Davide Donadio, and Michele Parrinello. Canonical sampling through velocity rescaling. The Journal of Chemical Physics, 126(1):014101, 2007. 51 [12] R. Coifman, I. Kevrekidis, S. Lafon, M. Maggioni, and B. Nadler. Diffusion Maps, Reduction Coordinates, and Low Dimensional Representation of Stochastic Systems. Multiscale Modeling & Simulation, 7(2):842–864, 2008. 19, 20 [13] Ronald R. Coifman and Stéphane Lafon. Diffusion maps. Applied and Computational Harmonic Analysis, 21(1):5–30, 2006. 20 [14] Evaldo M. F. Curado and Fernando D. Nobre. Derivation of nonlinear FokkerPlanck equations by means of approximations to the master equation. Phys. Rev. E, 67:021107, Feb 2003. 7 [15] Tom Darden, Darrin York, and Lee Pedersen. Particle mesh Ewald: An N [centerdot] log(N) method for Ewald sums in large systems. The Journal of Chemical Physics, 98(12):10089–10092, 1993. 49 [16] C. Dekker. Solid-state nanopores. Nature Nanotechnology, 2:209–215, April 2007. 42 [17] Christopher M. Dobson, Andrej Šali, and Martin Karplus. Proteinfaltung aus theoretischer und experimenteller Sicht. Angewandte Chemie, 110(7):908–935, 1998. 61 [18] Ron O. Dror, Robert M. Dirks, J. P. Grossman, Huafeng Xu, and David E. Shaw. Biomolecular Simulation: A Computational Microscope for Molecular Biology. Annual Review of Biophysics, 41(1):429–452, 2012. 37, 38, 46 [19] David J. Earl and Michael W. Deem. Parallel tempering: Theory, applications, and new perspectives. Phys. Chem. Chem. Phys., 7:3910–3916, 2005. 61 [20] A. Einstein. Über die von der molekularkinetischen Theorie der Wärme geforderte Bewegung von in ruhenden Flüssigkeiten suspendierten Teilchen. Ann. Phys., 1905. 8 74 Literaturverzeichnis [21] Evan Evans. Probing the relation between force—Llifetime—and chemistry in single molecular bonds. Annual Review of Biophysics and Biomolecular Structure, 30(1):105–128, 2001. PMID: 11340054. 37, 44 [22] T. E. Fisher, A. F. Oberhauser, M. Carrion-Vazquez, P. E. Marszalek, and J. M. Fernandez. The study of protein mechanics with the atomic force microscope. Trends in biochemical sciences, 24(10):379–384, 1999. 43, 44 [23] A. D. Fokker. Die mittlere energie rotierender elektrischer dipole im strahlungsfeld. Annalen der Physik, 348(5):810–820, 1914. 3 [24] E. F. Franca, A. M. Amarante, and F. L. Leite. Introduction to Atomic Force Microscopy Simulation. 2010. 37 [25] I. Franco, M. A. Ratner, and G. C. Schatz. Single-molecule pulling: phenomenology and interpretation. ArXiv e-prints, May 2012. 41, 45, 46, 47 [26] D. Frenkel and B. Smit. Understanding Molecular Simulation: From Algorithms to Applications. Computational Science Series, Vol 1. Elsevier Science, 2001. 22 [27] C. W. Gardiner. Handbook of Stochastic Methods for Physics, Chemistry and the Natural Sciences. 1985. 3, 9, 13, 15, 20 [28] Berk Hess, Carsten Kutzner, David van der Spoel, and Erik Lindahl. GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation. Journal of Chemical Theory and Computation, 4(3):435–447, 2008. 47, 48, 49 [29] William Humphrey, Andrew Dalke, and Klaus Schulten. VMD – Visual Molecular Dynamics. Journal of Molecular Graphics, 14:33–38, 1996. 39, 48, 53 [30] K. Itō and J. Henry P. McKean. Diffusion Processes and Their Sample Paths: Reprint of the 1974 Edition. Classics in Mathematics Series. Springer-Verlag GmbH, 1965. 13 [31] C. Jarzynski. Equilibrium free-energy differences from nonequilibrium measurements: A master-equation approach. Phys. Rev. E, 56:5018–5035, Nov 1997. 23, 46 75 Literaturverzeichnis [32] C. Jarzynski. Nonequilibrium Equality for Free Energy Differences. Phys. Rev. Lett., 78:2690–2693, Apr 1997. 46 [33] F. Jensen. Introduction to Computational Chemistry. Wiley, 2007. 38 [34] William L. Jorgensen, David S. Maxwell, and Julian Tirado-Rives. Development and Testing of the OPLS All-Atom Force Field on Conformational Energetics and Properties of Organic Liquids. Journal of the American Chemical Society, 118(45):11225–11236, 1996. 49 [35] George A. Kaminski, Richard A. Friesner, Julian Tirado-Rives, and William L. Jorgensen. Evaluation and Reparametrization of the OPLS-AA Force Field for Proteins via Comparison with Accurate Quantum Chemical Calculations on Peptides†. The Journal of Physical Chemistry B, 105(28):6474–6487, 2001. 49 [36] A. Kolmogorov. Über die analytischen methoden in der wahrscheinlichkeitsrechnung. Mathematische Annalen, 104:415–458, 1931. 3 [37] Shankar Kumar, Djamal Bouzida, Robert H. Swendsen, Peter A. Kollman, and John M. Rosenberg. The weighted histogram analysis method for free-energy calculations on biomolecules. I: The method. J. Comput. Chem., 13(8):1011–1021, October 1992. 47 [38] Alessandro Laio and Francesco L Gervasio. Metadynamics: a method to simulate rare events and reconstruct the free energy in biophysics, chemistry and material science. Reports on Progress in Physics, 71(12):126601, 2008. 61 [39] Alessandro Laio and Michele Parrinello. Escaping free-energy minima. Proceedings of the National Academy of Sciences, 99(20):12562–12566, 2002. 61 [40] P. L’Ecuyer. Maximally equidistributed combined Tausworthe generators. Mathematics of computation, 65(213):203–214, 1996. 26 [41] P. L’Ecuyer. Tables of maximally equidistributed combined LFSR generators. Mathematics of computation, 68(225):261–270, 1999. 26 [42] Justin A. Lemkul and David R. Bevan. Assessing the Stability of Alzheimer’s Amyloid Protofibrils Using Molecular Dynamics. The Journal of Physical Chemistry B, 114(4):1652–1660, 2010. PMID: 20055378. 35 76 Literaturverzeichnis [43] M. Levitt and A. Warshel. Computer simulation of protein folding. Nature, 253(5494):694–698, 1975. 38 [44] Michael Levitt. A simplified representation of protein conformations for rapid simulation of protein folding. Journal of Molecular Biology, 104(1):59–107, 1976. 38 [45] Erik Lindahl, Berk Hess, and David van der Spoel. GROMACS 3.0: a package for molecular simulation and trajectory analysis. Molecular modeling annual, 7:306– 317, 2001. 47 [46] Jan Liphardt, Bibiana Onoa, Steven B. Smith, Ignacio Tinoco, and Carlos Bustamante. Reversible Unfolding of Single RNA Molecules by Mechanical Force. Science, 292(5517):733–737, 2001. 43, 44 [47] Fabrizio Marinelli, Fabio Pietrucci, Alessandro Laio, and Stefano Piana. A Kinetic Model of Trp-Cage Folding from Multiple Biased Molecular Dynamics Simulations. PLoS Comput Biol, 5(8):e1000452+, August 2009. 39 [48] Simone Marsili and Piero Procacci. Free Energy Reconstruction in Bidirectional Force Spectroscopy Experiments: The Effect of the Device Stiffness. The Journal of Physical Chemistry B, 114(7):2509–2516, 2010. PMID: 20121079. 41, 53 [49] Giampaolo Merlini and Vittorio Bellotti. Molecular Mechanisms of Amyloidosis. New England Journal of Medicine, 349(6):583–596, 2003. 1, 41 [50] D.J. Muller, H. Janovjak, T. Lehto, L. Kuerschner, and K. Anderson. Observing structure, function and assembly of single proteins by AFM. Progress in Biophysics and Molecular Biology, 79(1):1–43, May 2002. 37 [51] Jonathan W. Neidigh, R. Matthew Fesinmeyer, and Niels H. Andersen. Designing a 20-residue protein. Nat Struct Mol Biol, 9(6):425–430, jun 2002. 39, 57 [52] Keir C. Neuman and Attila Nagy. Single-molecule force spectroscopy: optical tweezers, magnetic tweezers and atomic force microscopy. Nat Meth, 5(6):491– 505, jun 2008. 37, 41 [53] Shūichi Nosé. A molecular dynamics method for simulations in the canonical ensemble. Molecular Physics, 52(2):255–268, 1984. 50 77 Literaturverzeichnis [54] Robert L. Nussbaum and Christopher E. Ellis. Alzheimer’s Disease and Parkinson’s Disease. New England Journal of Medicine, 348(14):1356–1364, 2003. 1, 41 [55] Andres F. Oberhauser, Paul K. Hansma, Mariano Carrion-Vazquez, and Julio M. Fernandez. Stepwise unfolding of titin under force-clamp atomic force microscopy. Proceedings of the National Academy of Sciences, 98(2):468–472, 2001. 37, 41, 43 [56] José Nelson Onuchic, Zaida Luthey-Schulten, and Peter G. Wolynes. Theory of protein folding: The Energy Landscape Perspective. Annual Review of Physical Chemistry, 48(1):545–600, 1997. PMID: 9348663. 61 [57] W. Paul and J. Baschnagel. Stochastic processes: from physics to finance. Springer, 2000. 9, 13 [58] R. Pawula. Generalizations and extensions of the Fokker- Planck-Kolmogorov equations. Information Theory, IEEE Transactions on, 13(1):33–41, january 1967. 6 [59] R. F. Pawula. Approximation of the Linear Boltzmann Equation by the FokkerPlanck Equation. Phys. Rev., 162:186–188, Oct 1967. 6, 7 [60] Jed W. Pitera and William Swope. Understanding folding and design: Replicaexchange simulations of “Trp-cage” miniproteins. Proceedings of the National Academy of Sciences, 100(13):7587–7592, 2003. 39 [61] M. Planck. Sitzungsber. Preuss. Akad. Wiss. Phys. Math. Kl, 325, 1917. 3 [62] Srinivasan Ramachandran, Fernando Teran Arce, and Ratnesh Lal. Potential role of atomic force microscopy in systems biology. Wiley Interdisciplinary Reviews: Systems Biology and Medicine, 3(6):702–716, 2011. 36, 37 [63] L. E. Reichl. A Modern Course in Statistical Physics, 2nd Edition. February 1998. 5, 7, 14, 15 [64] Matthias Rief, Mathias Gautel, Filipp Oesterhelt, Julio M. Fernandez, and Hermann E. Gaub. Reversible Unfolding of Individual Titin Immunoglobulin Domains by AFM. Science, 276(5315):1109–1112, 1997. 43, 44 78 Literaturverzeichnis [65] H. Risken. The Fokker-Planck equation. Methods of solution and applications. 1989. 3, 9, 13, 15, 19, 20 [66] Mary A. Rohrdanz, Wenwei Zheng, Mauro Maggioni, and Cecilia Clementi. Determination of reaction coordinates via locally scaled diffusion map. The Journal of Chemical Physics, 134(12):124116, 2011. 20, 61 [67] Carlos Simmerling, Bentley Strockbine, and Adrian E. Roitberg. All-Atom Structure Prediction and Folding Simulations of a Stable Protein. Journal of the American Chemical Society, 124(38):11258–11259, 2002. 39 [68] Jens Smiatek and Andreas Heuer. Calculation of free energy landscapes: A histogram reweighted metadynamics approach. Journal of Computational Chemistry, pages 2084–2096, 2011. 61 [69] Jens Smiatek, Daniel Janssen-Mueller, Rudolf Friedrich, and Andreas Heuer. Hidden complexities in the unfolding mechanism of a cytosine-rich DNA strand. 2011. 61 [70] Christopher D. Snow, Bojan Zagrovic, and Vijay S. Pande. The Trp Cage: Folding Kinetics and Unfolded State Topology via Molecular Dynamics Simulations. Journal of the American Chemical Society, 124(49):14548–14549, 2002. PMID: 12465960. 39 [71] A. Szabó and N.S. Ostlund. Modern Quantum Chemistry: Introduction to Advanced Electronic Structure Theory. Dover Books on Chemistry Series. Dover Publ., 1989. 38 [72] Charles Tanford. Contribution of Hydrophobic Interactions to the Stability of the Globular Conformation of Proteins. Journal of the American Chemical Society, 84(22):4240–4247, 1962. 57 [73] G.M. Torrie and J.P. Valleau. Nonphysical sampling distributions in Monte Carlo free-energy estimation: Umbrella sampling. Journal of Computational Physics, 23(2):187–199, 1977. 46 [74] Masaru Tsukada. Theoretical Simulation of Scanning Probe Microscopy. Analytical Sciences, 27(2):121–121, 2011. 36 79 Literaturverzeichnis [75] Marc W van der Kamp, Katherine E Shaw, Christopher J Woods, and Adrian J Mulholland. Biomolecular simulation and modelling: status, progress and prospects. Journal of The Royal Society Interface, 5(Suppl 3):173–190, 2008. 37, 38, 46 [76] D. van der Spoel, E. Lindahl, B. Hess, A. R. van Buuren, E. Apol, P. J. Meulenhoff, D. P. Tieleman, A. L. T. M. Sijbers, K. A. Feenstra, R. van Drunen, and H. J. C. Berendsen. Gromacs User Manual version 4.0. www.gromacs.org, 2005. 47 [77] David Van der Spoel, Erik Lindahl, Berk Hess, Gerrit Groenhof, Alan E. Mark, and Herman J. C. Berendsen. GROMACS: Fast, flexible, and free. Journal of Computational Chemistry, 26(16):1701–1718, 2005. 47 [78] Marian von Smoluchowski. Abhandlungen über die Brownsche Bewegung und verwandte Erscheinungen. Akademische Verlagsgesellschaft, 1923. 8 [79] Wenwei Zheng, Bo Qi, Mary A. Rohrdanz, Amedeo Caflisch, Aaron R. Dinner, and Cecilia Clementi. Delineation of Folding Pathways of a β-Sheet Miniprotein. The Journal of Physical Chemistry B, 115(44):13065–13074, 2011. 20, 61 80