STN Express Schnellkurs

Mit diesem Schnellkurs soll versucht werden, eine kurze Einführung in die Benutzung der Datenbanken Beilstein und Cheminform RX zu geben.

Vorbemerkung

Unter STN gibt es drei Arten von Datenbanken: bibliographische Datenbanken (z.B. CA), Faktendatenbanken (z.B. Beilstein) und Volltext-Datenbanken (z.B. CJACS). Eine Datenbank besteht aus Datensätzen (Dokumenten), die in Felder aufgegliedert sind (z.B. AU = Autoren, MF = Molecular Formula bzw. Summenformel, RN = CAS Registry No., CN = Chemischer Name, STR = Struktur). Eine Online-Recherche gliedert sich in folgende Punkte:

Sowohl bei der Suche (SFIELDS) als auch bei der Anzeige (DFIELDS) ist die sinnvolle Auswahl der Felder von großer Bedeutung für das Ergebnis und die Kosten der Recherche. Empfehlenswert sind die Nutzung der Online-Hilfe (HELP) sowie des EXPAND-Kommandos als Test.

Starten von STN Express, LOGON

win :
ggf. "Trumpet Winsock" starten
Gruppe STN Express, STN Express Symbol STN Express (Doppelklick)
Menüpunkt Logon (oder Mausklick auf Symbol Telefon)
Capture Session: name.trn
(automatischen Login-Prozeß abwarten)

Welcome to STN International!  Enter x:
y
LOGINID:
PASSWORD:
TERMINAL (ENTER 1, 2, 3, OR ?):2

* * * * * * * * *   Welcome to STN International   * * * * * *

...

=>

Anmerkung: Die Sitzung soll in einer Datei mitprotokolliert werden; der Dateiname muß die Erweiterung .trn haben. Wenn der "Prompt" (=>), also die Eingabeaufforderung, erscheint, wartet das System auf die Eingabe eines Kommandos in der Retrieval-Sprache "Messenger". Hinweis: Groß- und Kleinschreibung werden nicht unterschieden. Kommandos können abgekürzt werden; allerdings erhält man dann weniger oder keine Hilfestellung.

Auswahl einer Datenbank, Online-Hilfe

Zuerst ist eine Datenbank mit Hilfe des FILE-Kommandos auszuwählen, wobei man als Argument den Namen der Datenbank angibt (z.B. BEILSTEIN oder CHEMINFORM):

=> FILE BEILSTEIN

Einige wichtige Hilfe-Kategorien (HELP):

=> HELP DIRECTORY     (Hilfe-Kategorien, Übersicht)
=> HELP CONTENT       (Inhalt der Datenbank)
=> HELP COMMANDS      (Befehls-Übersicht)
=> HELP SFIELDS       (Suchfelder)
=> HELP DFIELDS       (Anzeigefelder)
=> HELP COST          (Kostenstruktur der Recherche)

EXPAND: Nachschlagen der Suchbegriffe im Index

Suche nach Autoren im Feld AU. (Anm.: Im BEILSTEIN steht oftmals nur der erste Autor, Vornamen fehlen häufig.)

=> EXPAND KURRECK/AU
E1           1     KURPSEL/AU
E2           7     KURRAS/AU
E3          42 --> KURRECK/AU
E4         395     KURRECK, H/AU
E5         203     KURRECK, HARRY/AU
E6           4     KURREIN/AU
E7           4     KURREK, H/AU
E8          17     KURREK, HARRY/AU
E9           1     KURRSANOW/AU
...

Der Suchbegriff steht immer bei "E3". Durchführen der Suche:

=> SEARCH E3-E5,E7-E8
            42 KURRECK/AU
           395 "KURRECK, H"/AU
           203 "KURRECK, HARRY"/AU
             4 "KURREK, H"/AU
            17 "KURREK, HARRY"/AU
L1         656 (KURRECK/AU OR "KURRECK, H"/AU OR "KURRECK, HARRY"/AU OR "
               KURREK, H"/AU OR "KURREK, HARRY"/AU)

Man erhält eine Antwortliste L1 mit 656 Datensätzen. Alternativ hätte man auch mit einer "Trunkierung" suchen können:

SEARCH ("KURRECK?" OR "KURREK?")/AU
=> E KIRSTE/AU
...
E3          15 --> KIRSTE/AU
E4         168     KIRSTE, B/AU
E5         249     KIRSTE, BURKHARD/AU
...
=> SEA E3-E5
            15 KIRSTE/AU
           168 "KIRSTE, B"/AU
           249 "KIRSTE, BURKHARD"/AU
L2         422 (KIRSTE/AU OR "KIRSTE, B"/AU OR "KIRSTE, BURKHARD"/AU)

Bestimmung der Schnittmenge aus den Antwortlisten L1 und L2 sowie Anzeige des Ergebnisses (erster Treffer); zur Bestätigung der Vorgabe (in runden Klammern) tippt man . (Punkt Return):

=> SEA L1 AND L2
L3         255 L1 AND L2

=> DISPLAY
ENTER (L3), L# OR ?:.
ENTER ANSWER NUMBER OR RANGE (1):.
ENTER DISPLAY FORMAT (QRD):.

Dasselbe Ergebnis hätte man mit folgender Kurzeingabe erhalten:

=> D

Oder Anzeige der ersten fünf Datensätze der Antwortliste L3:

=> D L3 1-5

Das Standard-Anzeigeformat ("default") ist hier QRD (Query Related Data), bestehend aus der Substanzidentifikation (IDE) und dem Treffer (HIT). (Das kostenfreie Format TRIAL gibt es bei der Beilstein-Datenbank nicht mehr.)
Da die Kostenstruktur für die Datenbank Beilstein dahingehend geändert wurde, daß für Anschaltzeit und Suche nichts bezahlt werden muß, dafür aber sehr hohe Kosten für die Anzeige von Daten anfallen (z. Zt. 16,- DM pro Feld), sollte man darauf achten, daß man sich keine "unnötigen" Daten anzeigen läßt.
Über folgende Eingabe kann man sich eine gute Übersicht verschaffen:

=> D IDE RSD FA

Die darauf folgende Anzeige wird als ein Feld berechnet. Man erhält Substanzidentifikation (IDE), Angaben zu Ringsystemen (RSD, Ring System Data) und eine Liste der vorhandenen Anzeigefelder (FA, Field Availability). Grundsätzlich ist die Field Availability bei gleichzeitiger Anzeige eines weiteren IDE-Feldes kostenfrei, sonst verursacht sie jedoch Kosten wie jedes andere Feld.

Substanzsuche mit Suchbegriffen

CN - Chemical Name

Man kann im Feld CN (Chemical Name) nach dem (englischen) Namen einer Substanz suchen. Aufgrund unvollständiger namentlicher Erfassung sowie wegen Nomenklaturproblemen ist eine Namenssuche nur bedingt empfehlenswert; auf jeden Fall sollte ein EXPAND vorangehen.

=> EXP STRYCHNINE/CN
E1           2     STRYCHNIN; VERBINDUNG MIT METHYLARSONSAEURE/CN
E2           1     STRYCHNINDAEURE/CN
E3           2 --> STRYCHNINE/CN
E4           2     STRYCHNINE 21.ALPHA.,22.ALPHA.-GLYCOL/CN
E5           1     STRYCHNINE 21.BETA.,22.ALPHA.-GLYCOL/CN
...

=> EXP STRYCHNIN/CN
E1           3     STRYCHNIDINE; HYDROCHLORIDE/CN
E2           1     STRYCHNIDINE; PERCHLORATE/CN
E3           4 --> STRYCHNIN/CN
E4           1     STRYCHNIN-BENZYLOCHLORID/CN
E5           1     STRYCHNIN-HEXADECYLOBROMID/CN
...

=> SEA STRYCHNIN#/CN
L4           5 STRYCHNINE/CN

=> D 1-5

Man findet hier mehrere Treffer (Stereoisomere, ggf. auch isotopenmarkierte Verbindungen und geladene oder radikalische Spezies.) Im Beispiel war Nr. 5 der Naturstoff (-)-strychnine. Eine Übersicht über alle hierzu verfügbaren Informationen (Anzeige-Datenfelder) erhält man mittels "D FA" (Field Availability):

=> D 5 FA

Anzeige "Isolation from Natural Product" (INP):

=> D 5 INP

Anzeige der beschriebenen Synthesen, "Preparation" (PRE):

=> D 5 PRE

Suche von D-cysteine:

=> E D-CYSTEINE/CN
E1           1     D-CYSTEIN; HYDROCHLORID/CN
E2           1     D-CYSTEINAL/CN
E3           1 --> D-CYSTEINE/CN
E4           1     D-CYSTEINE ; HYDROCHLORIDE/CN
E5           1     D-CYSTEINE HYDROCHLORIDE MONOHYDRATE/CN
...
=> S E3
L6           1 D-CYSTEINE/CN

=> D RN,BPR

CAS Reg. No. (RN):          52-90-4; 921-01-7; 3374-22-9; 4371-52-2;
                            40143-64-4; 40143-66-6; 40143-69-9
Beilstein Pref. RN (BPR):   921-01-7

=> S 921-01-7/RN

L7           7 921-01-7/RN

Anmerkung: Die CAS Registry No. (RN) wird zunächst ohne Beachtung der Stereochemie ermittelt und verwendet; die stereochemisch korrekte Nummer findet man ggf. unter BPR (Beilstein Preferred Registry No.).

CNS - Chemical Name Segment

Abgesehen von "Rechts-Trunkierung" mittels "?" am Ende (und ggf. der Maskierung einzelner Buchstaben mittels "!") erfordert "CN" eine exakte Namensangabe, entsprechend einem Eintrag in der Datei. Bei komplizierteren Namen ist es empfehlenswert, mittels "CNS" nach Namensfragmenten zu suchen:

=> E DINITRO/CNS
E1          13     DINITRITE/CNS
E2           2     DINITRITO/CNS
E3       75420 --> DINITRO/CNS
E4           1     DINITROACEANTHRENE/CNS
...

=> E STYRYL/CNS
E1           4     STYRROL/CNS
E2           2     STYRRYL/CNS
E3       20499 --> STYRYL/CNS
E4           1     STYRYL1H/CNS
...

=> E BENZIMIDAZOLE/CNS
E1          13     BENZIMIDAZOLDIHYDRID/CNS
E2           7     BENZIMIDAZOLDIOL/CNS
E3        3493 --> BENZIMIDAZOLE/CNS
E4           2     BENZIMIDAZOLECARBALDEHYDE/CNS
...

=> s (DINITRO(L)STYRYL(L)BENZIMIDAZOLE)/CNS
         75420 DINITRO/CNS
         20499 STYRYL/CNS
          3493 BENZIMIDAZOLE/CNS
L9           1 (DINITRO(L)STYRYL(L)BENZIMIDAZOLE)/CNS

Hinweis: Mit dem Link-Operator (L) verknüpft man Begriffe, die in beliebiger Reihenfolge in derselben Informationseinheit stehen.

MF - Molecular Formula (Summenformel)

Die Summenformel wird nach dem Hill-System gebildet: erst C, dann H, dann alle anderen Symbole in alphabetischer Reihenfolge.

=> E C11H8DNOS/MF
E1           3     C11H8DNO3/MF
E2           5     C11H8DNO4/MF
E3           1 --> C11H8DNOS/MF
E4           3     C11H8F/MF
E5           2     C11H8F.K/MF
E6           2     C11H8F.LI/MF
E7           2     C11H8F.NA/MF
...

=> s e3
L10          1 C11H8DNOS/MF

=> D STR

Unterbrechung der Sitzung

Nach "LOGOFF HOLD" wird die Verbindung unterbrochen; alle Antwortlisten (L#) bleiben eine Stunde lang gespeichert.

(Sub-)Struktursuche

Mit STN Express kann man (Offline!) eine Struktur zeichnen. Dabei sind ggf. spezielle Kennzeichnungen oder Gruppierungen von Atomen oder Bindungen möglich, was insbesondere bei Substruktursuchen wichtig ist.

In STN Express: Menü Query, Prepare Structure Query. (bzw. Mausklick auf Symbol Bleistift auf Naphthalin, auch direkt aus der Terminal Emulation)

New. Standard. Molekül zeichnen. SAVE, EXIT STRUCTURE DRAWING.

Wiederaufnahme der Online-Sitzung:

Menü Logon, STN (oder Mausklick auf Symbol Telefon, auch in der Terminal Emulation); Continue Session.

"Upload" der Struktur:

Mausklick auf Symbol Q mit Pfeil in der Terminal Emulation, Auswahl der Datei (im Beispiel: test01.str).

=>
Uploading test01.str

L17     STRUCTURE UPLOADED

Anmerkung: Die L# (hier L17) ist ausnahmsweise keine Antwortliste. Es gibt darin noch keine "Struktur" (STR), sondern nur ein "Structure Image" (SIM):

=> D SIM

Durchführung einer "exakten" Suche:

=> search
ENTER LOGIC EXPRESSION, QUERY NAME, OR (END):l17
ENTER TYPE OF SEARCH (SSS), CSS, FAMILY, OR EXACT:exact
ENTER SCOPE OF SEARCH (SAMPLE), FULL, RANGE, OR SUBSET:full
FULL SEARCH INITIATED 13:46:34
FULL SCREEN SEARCH COMPLETED -      8 TO ITERATE
100.0% PROCESSED       8 ITERATIONS                            6 ANSWERS
SEARCH TIME: 00.00.05

L18           6 SEA EXA FUL L17

=> d 1-6

Hinweis: Bei einer Substruktursuche (SSS) sollte in jedem Fall zuerst eine (kostenfreie!) SAMPLE Suche durchgeführt werden.

Suche in CHEMINFORM RX

Struktursuche (CSS) unter Verwendung des obigen Beispiels (L17):

=> FILE CHEMINFORM

=> search
ENTER LOGIC EXPRESSION, QUERY NAME, OR (END):l17
ENTER TYPE OF SEARCH (SSS) OR CSS:css
ENTER SCOPE OF SEARCH (SAMPLE), FULL, RANGE, OR SUBSET:full
FULL SEARCH INITIATED 13:54:59
SCREENING COMPLETE -     53 REACTIONS TO VERIFY FROM     19 DOCUMENTS
100.0% DONE     53 VERIFIED       5 HIT RXNS                      1 DOCS
SEARCH TIME: 00.00.05

L22           1 SEA CSS FUL L17 (     5 REACTIONS)

=> d l22

Suche nach einer CAS Registry No. (im Basic Index, BI):

=> s 86461-59-8
L24          1 86461-59-8

=> d l24

Crossfile-Suche Beilstein / SpecInfo

Wenn es zu einer Verbindung ein Spektrum in der SpecInfo-Datenbank gibt (z.B. CNMR, IR, MS; kein H-NMR!), kann man die betreffenden Daten direkt aus der Beilstein-Datenbank abrufen.

=> FILE BEILSTEIN

=> e aspirin/cn
E1           4     ASPIDOSPERMINE/CN
E2           1     ASPILIAPARVIOL/CN
E3           1 --> ASPIRIN/CN
E4           1     ASPIRIN ACETOXYMETHYL ESTER/CN
...

=> s e3
L1           1 ASPIRIN/CN

=> d

=> d os

=> d xref

=> d specinfo.allc   (C-13 NMR)

=> d specinfo.str    (Struktur mit Numerierung)

=> d specinfo.allir  (IR)

=> d specinfo.allms  (MS; hier nicht vorhanden)

Arbeiten mit SpecInfo

Mit SpecInfo kann man, abgesehen vom Heraussuchen von C-NMR-, IR- oder MS-Spektren, insbesondere auch: C-NMR-Spektren abschätzen (RUN SPECAL) oder "ungefähr" passende Strukturen zu einem C-NMR-Spektrum suchen (RUN EDSPEC, RUN GETSPEC). Es ist wichtig, daß man Strukturen im SpecInfo-Format verwendet.

Anzeige von Spektren

C-NMR, IR und MS von 1,2-Dichlorbenzol:

=> s C6H4CL2/MF
L27          3 C6H4CL2/MF

=> d

=> d 2 fa

=> d 2 allc

=> d 2 allir

=> d 2 allms

Abschätzung eines C-13-NMR Spektrums

Abschätzung eines C-13-NMR Spektrums nach Upload einer Struktur im SpecInfo-Format:

=>
Uploading speci01.str

L28     STRUCTURE UPLOADED

=> d sim

=> run specal

  *** CALCULATION OF NMR SPECTRUM LINE VALUES ***

ENTER STRUCTURE QUERY L#  (L28 )  :.
CHARGED STRUCTURES EXCLUDED  -  POLAR SOLVENTS EXCLUDED

ENTER TYPE OF SPECTRUM (CNMR)     :.
ENTER NODE NUMBER(S) (ALL)        :.

L29   RUN STATEMENT CREATED

ENTER NODE NUMBER (END)  :.

Suche von Strukturen anhand von C-NMR-Daten

Beispiel: alpha-Pinen.

=> run edspec

  *** SPECINFO SPECTRUM EDITOR ***

ENTER TYPE OF SPECTRUM (?) :.

    To edit a spectrum, you must first enter the spectrum type.
    Valid spectrum types are CNMR, IR and MS.


ENTER TYPE OF SPECTRUM (?) :cnmr
:?

    To edit a CNMR spectrum, type in the line values in the
    following order:
         chemical shift, multiplicity, intensity, for example:
         : 112, d, 3.

:144, s, 1
:116, d, 1
:31.6, t, 1
:42, d, 1
:31, t, 1
:47, d, 1
:38, s, 1
:23, q, 1
:26, q, 1
:21, q, 1
:plot
:save
L30    RUN STATEMENT CREATED

=> run getspec

  *** SPECINFO SPECTRUM SIMILARITY SEARCH ***

ENTER SPECTRUM QUERY L#  (L30 )  :.
ENTER TYPE OF SPECTRUM (?)       :cnmr

L31   RUN STATEMENT CREATED

=> d

LOGOFF

Terminal Emulation: Mausklick auf Symbol ausgestrichenes Telefon.


Burkhard Kirste, 1994-11-28 (letzte Änderung 1996-12-03 DL)