Aufgabenstellung

Transcrição

Aufgabenstellung
Diplomarbeit
Programme und Scriptsprachen zum Handling von
Molekül-Konformationen
Betreuer:
Primärer Betreuer:
Vertretung:
Tobias Breiner
Christian Seiler
Motivation:
Im Internet gibt es für fast jedes Molekül ein passendes PDB-File. Trotzdem gibt es einige
Moleküle, die nicht als PDB-File vorhanden sind. Selbst wenn das Molekül als PDB-File
existiert, wird zumeist jeweils nur eine Konformation angegeben, die nicht unbedingt mit der
gewünschten Konformation übereinstimmen muss.
(Beispiel: Beim Molekül Citrat existiert nur die energieärmste Konformation als PDB-File,
jedoch nicht die Konformation, die das Citrat als Komplexbildner einnimmt)
Auch wäre es für Visualisierungseffekte oft hilfreich, zwei Moleküle in einem PDB-File zu
vereinen, um z.B. Enzym-Ligand-Effekte mit Chime zu visualisieren.
(Beispiel: Um Citrat als Komplexbildner zu visualisieren, wäre es hilfreich, auch das
gebundene Metallion einzublenden)
Daher wäre eine Molekül-Scriptsprache von großem Nutzen, welches nur die Verbindungen
der Atome zueinander zusammen mit einen Drehwinkel bzw. Drehwinkelbereich angibt,
jedoch nicht die jeweiligen Koordinaten der Atome. Mit dieser Scriptsprache könnte ein
Programm die verschiedenen Konformationen ausrechnen und daraus PDB-Files erstellen.
Aufgaben:
A1.) State-Of-The-Art-Analyse
Erst soll eine State-Of-The-Art-Analyse aller bisherigen chemischen Editoren, 3D-MolekülKonverter und Molekül-Scriptsprachen erstellt werden. Vor allem soll nach einem graphischorientierten chemischen Editor gesucht werden, der Strukturformeln erstellen kann und die
Verbindungen der Atome untereinander in einer geeigneten Scriptsprache abspeichert.
Falls das Molekül in sich drehbar ist und verschiedene räumliche Konformationen annehmen
kann, soll der Benutzer seine gewünschte Konformation auswählen können.
Die gesuchte Skriptsprache soll nur die Verbindungen der Atome inklusive Drehwinkel
enthalten, nicht jedoch die Absolute Position der Atome im Raum (wie z.B. das PDBFormat). Insbesondere soll untersucht werden, ob ChemTex den Anforderungen genügt, oder
um den Drehwinkel erweitert werden kann.
A2.) Entwicklung einer Molekül-Scriptsprache
Falls die State-Of-The-Art-Analyse ergeben sollte, dass keine geeignete Scriptsprache
existiert oder erweitert werden kann, so muss eine neue Scriptsprache definiert werden, in
denen Moleküle mit speziellen Konformation ausgedrückt werden können.
Ein Beispiel einer solchen Skriptsprache könnte in etwa folgendermaßen aussehen:
ATOMS:
C1, C2, O1, H1 ....
CONNECT:
C1, C2, 150
C2 , C3, 30
C2, O1, 20-170
O1, H1
..................
A3.) Übersetzungsprogramm von PDB-Files zur Molekül-Scriptsprache
Es soll ein Programm prototypisch implementiert werden, das PDB-Files parst und in diese
Molekül-Scriptsprache übersetzt. Wichtig ist eine knappe aber präzise Dokumentation des
Quellcodes (Insbesondere wird Wert auf die Beschreibung der Funktion der verwendeten
Klassen und Prozeduren.gelegt)
A4.) Übersetzungsprogramm von der Molekül-Scriptsprache in PDB-Files
Es soll ein Programm geschrieben werden, der die Molekül-Scriptsprache parst und in ein
PDB-File übersetzt, (also genau der umgekehrte Fall zu A3). Auch hier ist eine präzise
Dokumentation Pflicht.
A5.) Übersetzungsprogramm von der Molekül-Scriptsprache in VRML2
Ein „nice to have“ wäre auch ein Programm, welches ausgehend von der MolekülScriptsprache direkt ein VRML2-File erstellt. Konformationsänderungen könnten dabei
mittels Bewegungsinterpolatoren modelliert werden. Diese Aufgabe ist jedoch optional und
soll nur dann erledigt werden, wenn nach A4.) noch Zeit übrig sein sollte.
Sprache:
Visual C++ (oder, wenn lieber: Java)
Skizze:
Chemischer Editor
A1: Suche nach Programm:
Chemische Formel zu Molekül-Scriptsprache
Molekül-Scriptsprache (A2)
A4
A3
PDB-Textfile
(=im Brookhaven Data Base
Format)
A5
Vorhandenes Programm:
PDB zu VRML2
(von Cristian Seiler)
VRML2-Datei der
chemischen Formel
Einige nützliche URLs zum Thema:
http://www.rcsb.org/pdb/
http://www.rcsb.org/pdb/info.html#File_Formats_and_Standards
Einige nützliche Stickwörter für die State-Of-The-Art-Analyse:
•
•
•
•
ChemTex
ChemScript
MolCad
PDB (Brookhaven Protein Data Base)

Documentos relacionados