Mit diesem Schnellkurs soll versucht werden, eine kurze Einführung in die Benutzung der Datenbanken Beilstein und Cheminform RX zu geben.
Unter STN gibt es drei Arten von Datenbanken: bibliographische Datenbanken (z.B. CA), Faktendatenbanken (z.B. Beilstein) und Volltext-Datenbanken (z.B. CJACS). Eine Datenbank besteht aus Datensätzen (Dokumenten), die in Felder aufgegliedert sind (z.B. AU = Autoren, MF = Molecular Formula bzw. Summenformel, RN = CAS Registry No., CN = Chemischer Name, STR = Struktur). Eine Online-Recherche gliedert sich in folgende Punkte:
Sowohl bei der Suche (SFIELDS) als auch bei der Anzeige (DFIELDS) ist die sinnvolle Auswahl der Felder von großer Bedeutung für das Ergebnis und die Kosten der Recherche. Empfehlenswert sind die Nutzung der Online-Hilfe (HELP) sowie des EXPAND-Kommandos als Test.
Welcome to STN International! Enter x: y LOGINID: PASSWORD: TERMINAL (ENTER 1, 2, 3, OR ?):2 * * * * * * * * * Welcome to STN International * * * * * * ... =>
Anmerkung: Die Sitzung soll in einer Datei mitprotokolliert werden; der Dateiname muß die Erweiterung .trn haben. Wenn der "Prompt" (=>), also die Eingabeaufforderung, erscheint, wartet das System auf die Eingabe eines Kommandos in der Retrieval-Sprache "Messenger". Hinweis: Groß- und Kleinschreibung werden nicht unterschieden. Kommandos können abgekürzt werden; allerdings erhält man dann weniger oder keine Hilfestellung.
Zuerst ist eine Datenbank mit Hilfe des FILE-Kommandos auszuwählen, wobei man als Argument den Namen der Datenbank angibt (z.B. BEILSTEIN oder CHEMINFORM):
=> FILE BEILSTEIN
Einige wichtige Hilfe-Kategorien (HELP):
=> HELP DIRECTORY (Hilfe-Kategorien, Übersicht) => HELP CONTENT (Inhalt der Datenbank) => HELP COMMANDS (Befehls-Übersicht) => HELP SFIELDS (Suchfelder) => HELP DFIELDS (Anzeigefelder) => HELP COST (Kostenstruktur der Recherche)
Suche nach Autoren im Feld AU. (Anm.: Im BEILSTEIN steht oftmals nur der erste Autor, Vornamen fehlen häufig.)
=> EXPAND KURRECK/AU E1 1 KURPSEL/AU E2 7 KURRAS/AU E3 42 --> KURRECK/AU E4 395 KURRECK, H/AU E5 203 KURRECK, HARRY/AU E6 4 KURREIN/AU E7 4 KURREK, H/AU E8 17 KURREK, HARRY/AU E9 1 KURRSANOW/AU ...
Der Suchbegriff steht immer bei "E3". Durchführen der Suche:
=> SEARCH E3-E5,E7-E8
42 KURRECK/AU
395 "KURRECK, H"/AU
203 "KURRECK, HARRY"/AU
4 "KURREK, H"/AU
17 "KURREK, HARRY"/AU
L1 656 (KURRECK/AU OR "KURRECK, H"/AU OR "KURRECK, HARRY"/AU OR "
KURREK, H"/AU OR "KURREK, HARRY"/AU)
Man erhält eine Antwortliste L1 mit 656 Datensätzen. Alternativ hätte man auch mit einer "Trunkierung" suchen können:
SEARCH ("KURRECK?" OR "KURREK?")/AU
=> E KIRSTE/AU
...
E3 15 --> KIRSTE/AU
E4 168 KIRSTE, B/AU
E5 249 KIRSTE, BURKHARD/AU
...
=> SEA E3-E5
15 KIRSTE/AU
168 "KIRSTE, B"/AU
249 "KIRSTE, BURKHARD"/AU
L2 422 (KIRSTE/AU OR "KIRSTE, B"/AU OR "KIRSTE, BURKHARD"/AU)
Bestimmung der Schnittmenge aus den Antwortlisten L1 und L2 sowie Anzeige des Ergebnisses (erster Treffer); zur Bestätigung der Vorgabe (in runden Klammern) tippt man . (Punkt Return):
=> SEA L1 AND L2 L3 255 L1 AND L2 => DISPLAY ENTER (L3), L# OR ?:. ENTER ANSWER NUMBER OR RANGE (1):. ENTER DISPLAY FORMAT (QRD):.
Dasselbe Ergebnis hätte man mit folgender Kurzeingabe erhalten:
=> D
Oder Anzeige der ersten fünf Datensätze der Antwortliste L3:
=> D L3 1-5
Das Standard-Anzeigeformat ("default") ist hier QRD (Query
Related Data), bestehend aus der Substanzidentifikation (IDE) und dem Treffer
(HIT). (Das kostenfreie Format TRIAL gibt es bei der Beilstein-Datenbank
nicht mehr.)
Da die Kostenstruktur für die Datenbank Beilstein dahingehend
geändert wurde, daß für Anschaltzeit und Suche nichts bezahlt
werden muß, dafür aber sehr hohe Kosten für die Anzeige
von Daten anfallen (z. Zt. 16,- DM pro Feld), sollte man darauf achten,
daß man sich keine "unnötigen" Daten anzeigen läßt.
Über folgende Eingabe kann man sich eine gute Übersicht verschaffen:
=> D IDE RSD FA
Die darauf folgende Anzeige wird als ein Feld berechnet. Man erhält Substanzidentifikation (IDE), Angaben zu Ringsystemen (RSD, Ring System Data) und eine Liste der vorhandenen Anzeigefelder (FA, Field Availability). Grundsätzlich ist die Field Availability bei gleichzeitiger Anzeige eines weiteren IDE-Feldes kostenfrei, sonst verursacht sie jedoch Kosten wie jedes andere Feld.
Man kann im Feld CN (Chemical Name) nach dem (englischen) Namen einer Substanz suchen. Aufgrund unvollständiger namentlicher Erfassung sowie wegen Nomenklaturproblemen ist eine Namenssuche nur bedingt empfehlenswert; auf jeden Fall sollte ein EXPAND vorangehen.
=> EXP STRYCHNINE/CN E1 2 STRYCHNIN; VERBINDUNG MIT METHYLARSONSAEURE/CN E2 1 STRYCHNINDAEURE/CN E3 2 --> STRYCHNINE/CN E4 2 STRYCHNINE 21.ALPHA.,22.ALPHA.-GLYCOL/CN E5 1 STRYCHNINE 21.BETA.,22.ALPHA.-GLYCOL/CN ... => EXP STRYCHNIN/CN E1 3 STRYCHNIDINE; HYDROCHLORIDE/CN E2 1 STRYCHNIDINE; PERCHLORATE/CN E3 4 --> STRYCHNIN/CN E4 1 STRYCHNIN-BENZYLOCHLORID/CN E5 1 STRYCHNIN-HEXADECYLOBROMID/CN ... => SEA STRYCHNIN#/CN L4 5 STRYCHNINE/CN => D 1-5
Man findet hier mehrere Treffer (Stereoisomere, ggf. auch isotopenmarkierte Verbindungen und geladene oder radikalische Spezies.) Im Beispiel war Nr. 5 der Naturstoff (-)-strychnine. Eine Übersicht über alle hierzu verfügbaren Informationen (Anzeige-Datenfelder) erhält man mittels "D FA" (Field Availability):
=> D 5 FA
Anzeige "Isolation from Natural Product" (INP):
=> D 5 INP
Anzeige der beschriebenen Synthesen, "Preparation" (PRE):
=> D 5 PRE
Suche von D-cysteine:
=> E D-CYSTEINE/CN
E1 1 D-CYSTEIN; HYDROCHLORID/CN
E2 1 D-CYSTEINAL/CN
E3 1 --> D-CYSTEINE/CN
E4 1 D-CYSTEINE ; HYDROCHLORIDE/CN
E5 1 D-CYSTEINE HYDROCHLORIDE MONOHYDRATE/CN
...
=> S E3
L6 1 D-CYSTEINE/CN
=> D RN,BPR
CAS Reg. No. (RN): 52-90-4; 921-01-7; 3374-22-9; 4371-52-2;
40143-64-4; 40143-66-6; 40143-69-9
Beilstein Pref. RN (BPR): 921-01-7
=> S 921-01-7/RN
L7 7 921-01-7/RN
Anmerkung: Die CAS Registry No. (RN) wird zunächst ohne Beachtung der Stereochemie ermittelt und verwendet; die stereochemisch korrekte Nummer findet man ggf. unter BPR (Beilstein Preferred Registry No.).
Abgesehen von "Rechts-Trunkierung" mittels "?" am Ende (und ggf. der Maskierung einzelner Buchstaben mittels "!") erfordert "CN" eine exakte Namensangabe, entsprechend einem Eintrag in der Datei. Bei komplizierteren Namen ist es empfehlenswert, mittels "CNS" nach Namensfragmenten zu suchen:
=> E DINITRO/CNS
E1 13 DINITRITE/CNS
E2 2 DINITRITO/CNS
E3 75420 --> DINITRO/CNS
E4 1 DINITROACEANTHRENE/CNS
...
=> E STYRYL/CNS
E1 4 STYRROL/CNS
E2 2 STYRRYL/CNS
E3 20499 --> STYRYL/CNS
E4 1 STYRYL1H/CNS
...
=> E BENZIMIDAZOLE/CNS
E1 13 BENZIMIDAZOLDIHYDRID/CNS
E2 7 BENZIMIDAZOLDIOL/CNS
E3 3493 --> BENZIMIDAZOLE/CNS
E4 2 BENZIMIDAZOLECARBALDEHYDE/CNS
...
=> s (DINITRO(L)STYRYL(L)BENZIMIDAZOLE)/CNS
75420 DINITRO/CNS
20499 STYRYL/CNS
3493 BENZIMIDAZOLE/CNS
L9 1 (DINITRO(L)STYRYL(L)BENZIMIDAZOLE)/CNS
Hinweis: Mit dem Link-Operator (L) verknüpft man Begriffe, die in beliebiger Reihenfolge in derselben Informationseinheit stehen.
Die Summenformel wird nach dem Hill-System gebildet: erst C, dann H, dann alle anderen Symbole in alphabetischer Reihenfolge.
=> E C11H8DNOS/MF E1 3 C11H8DNO3/MF E2 5 C11H8DNO4/MF E3 1 --> C11H8DNOS/MF E4 3 C11H8F/MF E5 2 C11H8F.K/MF E6 2 C11H8F.LI/MF E7 2 C11H8F.NA/MF ... => s e3 L10 1 C11H8DNOS/MF => D STR
Nach "LOGOFF HOLD" wird die Verbindung unterbrochen; alle Antwortlisten (L#) bleiben eine Stunde lang gespeichert.
Mit STN Express kann man (Offline!) eine Struktur zeichnen. Dabei sind ggf. spezielle Kennzeichnungen oder Gruppierungen von Atomen oder Bindungen möglich, was insbesondere bei Substruktursuchen wichtig ist.
In STN Express: Menü Query, Prepare Structure Query. (bzw. Mausklick
auf
,
auch direkt aus der Terminal Emulation)
New. Standard. Molekül zeichnen. SAVE, EXIT STRUCTURE DRAWING.
Wiederaufnahme der Online-Sitzung:
Menü Logon, STN (oder Mausklick auf
,
auch in der Terminal Emulation); Continue Session.
"Upload" der Struktur:
Mausklick auf
in
der Terminal Emulation, Auswahl der Datei (im Beispiel: test01.str).
=> Uploading test01.str L17 STRUCTURE UPLOADED
Anmerkung: Die L# (hier L17) ist ausnahmsweise keine Antwortliste. Es gibt darin noch keine "Struktur" (STR), sondern nur ein "Structure Image" (SIM):
=> D SIM
Durchführung einer "exakten" Suche:
=> search ENTER LOGIC EXPRESSION, QUERY NAME, OR (END):l17 ENTER TYPE OF SEARCH (SSS), CSS, FAMILY, OR EXACT:exact ENTER SCOPE OF SEARCH (SAMPLE), FULL, RANGE, OR SUBSET:full FULL SEARCH INITIATED 13:46:34 FULL SCREEN SEARCH COMPLETED - 8 TO ITERATE 100.0% PROCESSED 8 ITERATIONS 6 ANSWERS SEARCH TIME: 00.00.05 L18 6 SEA EXA FUL L17 => d 1-6
Hinweis: Bei einer Substruktursuche (SSS) sollte in jedem Fall zuerst eine (kostenfreie!) SAMPLE Suche durchgeführt werden.
Struktursuche (CSS) unter Verwendung des obigen Beispiels (L17):
=> FILE CHEMINFORM => search ENTER LOGIC EXPRESSION, QUERY NAME, OR (END):l17 ENTER TYPE OF SEARCH (SSS) OR CSS:css ENTER SCOPE OF SEARCH (SAMPLE), FULL, RANGE, OR SUBSET:full FULL SEARCH INITIATED 13:54:59 SCREENING COMPLETE - 53 REACTIONS TO VERIFY FROM 19 DOCUMENTS 100.0% DONE 53 VERIFIED 5 HIT RXNS 1 DOCS SEARCH TIME: 00.00.05 L22 1 SEA CSS FUL L17 ( 5 REACTIONS) => d l22
Suche nach einer CAS Registry No. (im Basic Index, BI):
=> s 86461-59-8 L24 1 86461-59-8 => d l24
Wenn es zu einer Verbindung ein Spektrum in der SpecInfo-Datenbank gibt (z.B. CNMR, IR, MS; kein H-NMR!), kann man die betreffenden Daten direkt aus der Beilstein-Datenbank abrufen.
=> FILE BEILSTEIN => e aspirin/cn E1 4 ASPIDOSPERMINE/CN E2 1 ASPILIAPARVIOL/CN E3 1 --> ASPIRIN/CN E4 1 ASPIRIN ACETOXYMETHYL ESTER/CN ... => s e3 L1 1 ASPIRIN/CN => d => d os => d xref => d specinfo.allc (C-13 NMR) => d specinfo.str (Struktur mit Numerierung) => d specinfo.allir (IR) => d specinfo.allms (MS; hier nicht vorhanden)
Mit SpecInfo kann man, abgesehen vom Heraussuchen von C-NMR-, IR- oder MS-Spektren, insbesondere auch: C-NMR-Spektren abschätzen (RUN SPECAL) oder "ungefähr" passende Strukturen zu einem C-NMR-Spektrum suchen (RUN EDSPEC, RUN GETSPEC). Es ist wichtig, daß man Strukturen im SpecInfo-Format verwendet.
C-NMR, IR und MS von 1,2-Dichlorbenzol:
=> s C6H4CL2/MF L27 3 C6H4CL2/MF => d => d 2 fa => d 2 allc => d 2 allir => d 2 allms
Abschätzung eines C-13-NMR Spektrums nach Upload einer Struktur im SpecInfo-Format:
=> Uploading speci01.str L28 STRUCTURE UPLOADED => d sim => run specal *** CALCULATION OF NMR SPECTRUM LINE VALUES *** ENTER STRUCTURE QUERY L# (L28 ) :. CHARGED STRUCTURES EXCLUDED - POLAR SOLVENTS EXCLUDED ENTER TYPE OF SPECTRUM (CNMR) :. ENTER NODE NUMBER(S) (ALL) :. L29 RUN STATEMENT CREATED ENTER NODE NUMBER (END) :.
Beispiel: alpha-Pinen.
=> run edspec
*** SPECINFO SPECTRUM EDITOR ***
ENTER TYPE OF SPECTRUM (?) :.
To edit a spectrum, you must first enter the spectrum type.
Valid spectrum types are CNMR, IR and MS.
ENTER TYPE OF SPECTRUM (?) :cnmr
:?
To edit a CNMR spectrum, type in the line values in the
following order:
chemical shift, multiplicity, intensity, for example:
: 112, d, 3.
:144, s, 1
:116, d, 1
:31.6, t, 1
:42, d, 1
:31, t, 1
:47, d, 1
:38, s, 1
:23, q, 1
:26, q, 1
:21, q, 1
:plot
:save
L30 RUN STATEMENT CREATED
=> run getspec
*** SPECINFO SPECTRUM SIMILARITY SEARCH ***
ENTER SPECTRUM QUERY L# (L30 ) :.
ENTER TYPE OF SPECTRUM (?) :cnmr
L31 RUN STATEMENT CREATED
=> d
Terminal Emulation: Mausklick auf
.