Dissertation József Ferincz

Freie Universität Berlin, 1994

Entwicklung zweier Programmsysteme zur Konstruktion von 3D-Molekülmodellen organischer Verbindungen nach neuen Konzepten

- Das Expertensystem ROCOCO2

- Der Aliphatenkonstruktor PROOPT

Zusammenfassung

Um die Eigenschaften organischer Verbindungen zu verstehen, braucht man Kenntnisse über ihre 3-dimensionale (3D-)Struktur. Im Rahmen dieser Dissertation wurde ein Expertensystem (Programmpaket) erstellt, das die 3D-Geometrie organischer Moleküle anhand einer Wissensbasis prognostiziert, sowie ein Konstruktor für acyclische Verbindungen, der mit einem neuen geometrischen Optimierungsverfahren arbeitet.

Das Expertensystem ROCOCO2 konstruiert Molekülmodelle nach einem neuen Konzept: Es fügt 'voroptimierte' Partialstrukturen schrittweise zusammen. Diese Partialstrukturen (Fragmente) berücksichtigen Wechselwirkungen über fünf Bindungen hinweg und stammen aus experimentellen Untersuchungen (Röntgenmethoden) an existierenden Molekülen. Ihre Optimierung wurde durch die "Natur als Supercomputer" vorgenommen. Auf diese Weise wurde ein Verfahren erhalten, das realitätsnahe Modelle ohne numerische Optimierung schnell aufbaut.

Das Expertensystem konstruiert 3-dimensionale Molekülmodelle aus den Strukturformeln (2-dimensionale Zeichnungen) nach bestimmten Ähnlichkeitsprinzipien. Es werden dabei einige Typen von Stereoisomeren berücksichtigt: unterschiedliche Konfigurationen an Asymmetriezentren und Kumulenen, cis- und trans- bzw. E- und Z-Isomere bei Cyclo- und Heterocycloaliphaten, sowie bei Alkenen, Kumulenen, Iminen und Azoverbindungen. Die für die Konstruktion eines Zielmodells benötigten Fragmente werden einer Wissensbasis entnommen. Dafür wurde eine Datenbankstruktur entwickelt, die aus einer Hauptdatenbank und einer Analogdatenbank besteht. In der Hauptdatenbank sind die Fragmente mit konkreten Atomen, in der Analogdatenbank die Analoga (Partialstrukturen mit Dummyatomen) abgelegt. Jedes Analogon erlaubt die Bildung einer enormen Zahl heteroatomhaltiger Fragmentfiles. Durch diese neue Technik (Anwendung eines Ähnlichkeitsprinzips) wird die Leistungsfähigkeit der Wissensbasis beträchtlich gesteigert.

Um die Fragmente in den Datenbanken sicher auffinden zu können, wurde eine lineare Codierung entwickelt, die erlaubt, auch stereochemische Eigenschaften der Fragmente in die Suche miteinzubeziehen. Die asymmetrischen Atome werden anhand graphentheoretischer Prinzipien erkannt. Es wurden Programme entwickelt, um Füllung, Aktualisierung und Verwaltung der Datenbanken automatisiert ausführen zu können. Die Fragmente werden wie folgt aus experimentell gewonnenen Daten (z. B. Röntgendaten) erhalten: Input von Moleküldaten im MDL-Molfile-Format; Kontrolle der Bindigkeiten und Ladungen der Atome sowie der Bindungstypen, Erkennung von Ringen und mesomeren Systemen einschließlich Aromaten, ggf. Fehlerkorrektur im Molfile; Erkennung geeigneter Partialstrukturen durch schrittweises Abtasten des Gesamtmoleküls; Ermittlung und Einfügung von Stereoparametern in die Fragmentmolfiles; Bildung eineindeutiger Fragmentcodes (unique names) anhand graphentheoretischer Methoden (nach Kanonisierung); Ablegen in den Datenbanken. Alle diese Vorgänge verlaufen automatisch.

Für die Konstruktion wurde eine neue Methode entwickelt, um die Probleme zu lösen, die auf die graphentheoretische Ununterscheidbarkeit mancher Atome zurückzuführen waren ('Fangkugel-Methode'). Das Expertensystem ist nicht anwendbar zur Ermittlung der 3D-Geometrie von Komplexen und von Verbindungen, bei denen die Struktur stark von intermolekularen und/oder weitreichenden intramolekularen Wechselwirkungen bestimmt ist.

In einer frühen Phase der vorliegenden Arbeit entstand auch ein Konstruktor (PROOPT), der zum Aufbau von acyclischen Modellen geeignet ist. Er berechnet Torsionswinkel Bindung für Bindung für das ganze Modell und arbeitet im Bereich weniger Sekunden. Der Optimierungsrechnung liegt ein bisher nicht angewendetes geometrisches Modell zugrunde, das mit Atomradien arbeitet ('Schattenmodell').

Das Expertensystem und PROOPT wurden auf einem verbreiteten Computertyp (PC) mit dem gängigsten Betriebsystem (MS-DOS/MS-WINDOWS) unter Verwendung von Borland Pascal 7.0 entwickelt. Dabei wurde Wert darauf gelegt, daß es auch von Anwendern mit wenig Computererfahrung leicht zu bedienen ist. Gegenwärtig können mit beiden Systemen Modelle mit maximal 999 Atomen erstellt werden, diese Einschränkung ist aber nur durch das MDL-MolfileFormat bedingt. ROCOCO2 umfaßt mehr als 16000 Zeilen, PROOPT ca. 4300 Zeilen Quellcode.


HTML-Formatierung: Burkhard Kirste, 1994/12/19