Aufgabenstellung
Transcrição
Aufgabenstellung
Diplomarbeit Programme und Scriptsprachen zum Handling von Molekül-Konformationen Betreuer: Primärer Betreuer: Vertretung: Tobias Breiner Christian Seiler Motivation: Im Internet gibt es für fast jedes Molekül ein passendes PDB-File. Trotzdem gibt es einige Moleküle, die nicht als PDB-File vorhanden sind. Selbst wenn das Molekül als PDB-File existiert, wird zumeist jeweils nur eine Konformation angegeben, die nicht unbedingt mit der gewünschten Konformation übereinstimmen muss. (Beispiel: Beim Molekül Citrat existiert nur die energieärmste Konformation als PDB-File, jedoch nicht die Konformation, die das Citrat als Komplexbildner einnimmt) Auch wäre es für Visualisierungseffekte oft hilfreich, zwei Moleküle in einem PDB-File zu vereinen, um z.B. Enzym-Ligand-Effekte mit Chime zu visualisieren. (Beispiel: Um Citrat als Komplexbildner zu visualisieren, wäre es hilfreich, auch das gebundene Metallion einzublenden) Daher wäre eine Molekül-Scriptsprache von großem Nutzen, welches nur die Verbindungen der Atome zueinander zusammen mit einen Drehwinkel bzw. Drehwinkelbereich angibt, jedoch nicht die jeweiligen Koordinaten der Atome. Mit dieser Scriptsprache könnte ein Programm die verschiedenen Konformationen ausrechnen und daraus PDB-Files erstellen. Aufgaben: A1.) State-Of-The-Art-Analyse Erst soll eine State-Of-The-Art-Analyse aller bisherigen chemischen Editoren, 3D-MolekülKonverter und Molekül-Scriptsprachen erstellt werden. Vor allem soll nach einem graphischorientierten chemischen Editor gesucht werden, der Strukturformeln erstellen kann und die Verbindungen der Atome untereinander in einer geeigneten Scriptsprache abspeichert. Falls das Molekül in sich drehbar ist und verschiedene räumliche Konformationen annehmen kann, soll der Benutzer seine gewünschte Konformation auswählen können. Die gesuchte Skriptsprache soll nur die Verbindungen der Atome inklusive Drehwinkel enthalten, nicht jedoch die Absolute Position der Atome im Raum (wie z.B. das PDBFormat). Insbesondere soll untersucht werden, ob ChemTex den Anforderungen genügt, oder um den Drehwinkel erweitert werden kann. A2.) Entwicklung einer Molekül-Scriptsprache Falls die State-Of-The-Art-Analyse ergeben sollte, dass keine geeignete Scriptsprache existiert oder erweitert werden kann, so muss eine neue Scriptsprache definiert werden, in denen Moleküle mit speziellen Konformation ausgedrückt werden können. Ein Beispiel einer solchen Skriptsprache könnte in etwa folgendermaßen aussehen: ATOMS: C1, C2, O1, H1 .... CONNECT: C1, C2, 150 C2 , C3, 30 C2, O1, 20-170 O1, H1 .................. A3.) Übersetzungsprogramm von PDB-Files zur Molekül-Scriptsprache Es soll ein Programm prototypisch implementiert werden, das PDB-Files parst und in diese Molekül-Scriptsprache übersetzt. Wichtig ist eine knappe aber präzise Dokumentation des Quellcodes (Insbesondere wird Wert auf die Beschreibung der Funktion der verwendeten Klassen und Prozeduren.gelegt) A4.) Übersetzungsprogramm von der Molekül-Scriptsprache in PDB-Files Es soll ein Programm geschrieben werden, der die Molekül-Scriptsprache parst und in ein PDB-File übersetzt, (also genau der umgekehrte Fall zu A3). Auch hier ist eine präzise Dokumentation Pflicht. A5.) Übersetzungsprogramm von der Molekül-Scriptsprache in VRML2 Ein „nice to have“ wäre auch ein Programm, welches ausgehend von der MolekülScriptsprache direkt ein VRML2-File erstellt. Konformationsänderungen könnten dabei mittels Bewegungsinterpolatoren modelliert werden. Diese Aufgabe ist jedoch optional und soll nur dann erledigt werden, wenn nach A4.) noch Zeit übrig sein sollte. Sprache: Visual C++ (oder, wenn lieber: Java) Skizze: Chemischer Editor A1: Suche nach Programm: Chemische Formel zu Molekül-Scriptsprache Molekül-Scriptsprache (A2) A4 A3 PDB-Textfile (=im Brookhaven Data Base Format) A5 Vorhandenes Programm: PDB zu VRML2 (von Cristian Seiler) VRML2-Datei der chemischen Formel Einige nützliche URLs zum Thema: http://www.rcsb.org/pdb/ http://www.rcsb.org/pdb/info.html#File_Formats_and_Standards Einige nützliche Stickwörter für die State-Of-The-Art-Analyse: • • • • ChemTex ChemScript MolCad PDB (Brookhaven Protein Data Base)