Chemie.DE

Projekt zum Aufbau eines Internet-Informationsdienstes für die Chemie

Auszug aus einem Projektantrag beim DFN-Verein (1996) - nur noch von historischem Interesse!

Einleitung

Die komplexen Aufgaben, denen sich die Chemie bei der Analyse von Stoffen, der Entwicklung neuer Produkte und der Vorhersage von Eigenschaften gegenübersieht, erfordern den immer stärkeren Einsatz der Datenverarbeitung auf diesem Gebiet. Während durch aufwendige Simulationsrechnungen die Chemie zu einem der Hauptabnehmer von Rechenleistung im wissenschaftlichen Bereich geworden ist, liefern Analysegeräte in kurzer Zeit Meßergebnisse, deren Deutung nur noch durch intelligente Verfahren der Informationsverarbeitung in vertretbarer Zeit möglich ist. Hinzu kommt eine Flut von Informationen, die auf den Netzen und in Datenbanken zu chemischen und biochemischen Fragestellungen angeboten werden, deren Einordnung und rationelle Sichtung den einzelnen Wissenschaftler in vielen Fällen jedoch zeitlich überfordert. Die Einrichtung eines zentralen Informationsservice für das Gebiet der Chemie kann entscheidend dazu beitragen, das Informationsangebot sinnvoll zu strukturieren und damit effizient nutzbar zu machen.

Aufgrund der besonderen Darstellung in chemischen Formeln oder Aminosäuresequenzen (2-dimensional) beziehungsweise in räumlichen Strukturen und Oberflächen (3-dimensional), seit neuestem auch in Videosequenzen von chemischen Reaktionen, werden spezielle Anforderungen an Darstellung und Suchstrategie auf diesem Fachgebiet gestellt. Hierfür gibt es zur Zeit nur Ansätze, die - möglichst in internationaler Zusammenarbeit - weiterentwickelt und standardisiert werden müssen.

Durch die Vielzahl des Angebots an Public-Domain- und kommerzieller Software auf dem Gebiet der Chemie und Biochemie wird die Auswahl der für eine bestimmte Aufgabenstellung einzusetzenden Produkte immer schwieriger; für eine bessere Übersichtlichkeit müssen an einer zentralen Stelle Kurzbeschreibungen und Adressen von Ansprechpartnern für ein möglichst vollständiges Spektrum chemisch orientierter Software bereitgehalten werden. Generell sollten diese Daten sowohl als Listen als auch in Form von Datenbanken mit leicht zu bedienenden Suchwerkzeugen bereitstehen.

Die Unüberschaubarkeit der bereits heute im Internet angebotenen Information verlangt für einzelne Fachgebiete eine Sammlung von Dokumentinhalten fachspezifischer Server, wiederum als Datenbank mit verschiedenen Suchkriterien (z.B. Lokalisation, Arbeitsgebiet, Untersuchungsmethoden, eventuell auch Personen).

Auf einem zentralen Informationsserver für den Bereich der Chemie müssen auch Dienstprogramme für eine leichtere Einsetzbarkeit von Software auf unterschiedlichen Rechnerplattformen angeboten werden sowie Datenbanken von allgemeinem Interesse, z.B. über Gefahrstoffe; daneben ist das Angebot eines Tagungs- und Veranstaltungskalenders und einer Jobbörse sicherlich von Nutzen.

Gegenüber den großen Datenbankanbietern muß eine zentrale Stelle darauf dringen, daß benutzerfreundliche und modernen Anforderungen entsprechende Schnittstellen zur Verfügung gestellt werden; hierbei muß auch über Zugangsbeschränkungen und mögliche Abrechnungsmodelle nachgedacht werden.

Die Veröffentlichung von Preprints, wie in anderen Fachgebieten üblich, sollte zumindest diskutiert werden; dagegen können für Aufgaben wie die Bereitstellung von Lehrprogrammen oder einheitlicher, benutzerfreundlicher Zugriff auf Fachbibliotheken im Rahmen des Projekts nur Vorarbeiten geleistet werden.

Am Fachbereich Chemie der Freien Universität Berlin wurde im Juni 1993 der erste WWW-Server auf dem Gebiet der Chemie in Deutschland eingerichtet. Auf diesem Server sind bereits viele der oben beschriebenen Aufgaben in Ansätzen verwirklicht, so daß - zusammen mit der großen installierten Softwarebasis und einer schnellen Netzanbindung - optimale Voraussetzungen für die Durchführung eines Projekts dieses Anspruchs vorliegen.

back Übersicht


Bezeichnung des Projekts

Projekttitel:
Aufbau eines Internet-Informationsdienstes für die Chemie
Kürzel:
Chemie.DE
Dieses Kürzel soll als Domainname beim DE-NIC beantragt werden, so daß der Server unter diesem Namen oder unter www.chemie.de erreichbar ist.
Projektleitung
Dr. Wolfgang Dreißig
Dr. Holger Busse
Teilnehmende Einrichtung
Fachbereich Chemie der Freien Universität Berlin
Projektlaufzeit
1. Novenber 1996 bis 31. Oktober 1998 (24 Monate)
back Übersicht

Beschreibung des Projekts

Projektziel

Es sollen ein WWW- und ein damit verbundener FTP-Server für die Fachgebiete Chemie und Biochemie aufgebaut und betrieben werden, auf denen fachspezifische Informationen aufbereitet und den Nutzern angeboten werden. Die Projektarbeit gliedert sich in die Hauptaufgabengebiete Im folgenden werden die Aufgabengebiete im einzelnen beschrieben.

Bereitstellung von Metainformationen:

back Übersicht

Statt der Einrichtung eines WWW-Servers als zentralem Informationsvermittlungsinstrument wurde auch Hyper-G als Basis diskutiert. Dieses Medium ist jedoch bisher noch wenig verbreitet, vor allem aber erfordert es wegen der notwendigen Anmeldung der Seiten eine stärkere Einbindung aller beteiligten Sites; dies würde sich auf freiwilliger Basis wohl nur schwer erreichen lassen.

Um so stärker muß bei dem aufzubauenden WWW-Server eine ständige Überprüfung der Konsistenz aller am Server referierten Links sowie deren Vernetzung betrieben werden; Werkzeuge hierfür existieren bereits (Lycos www search engine) und sind gegebenenfalls vom Projekt "Zentrales Referenz- und Kompetenzzentrum für Informationsverarbeitung" zu adaptieren.

Ebenfalls in Kooperation mit diesem Projekt müssen Tools zum Durchsuchen von WWW-Seiten nach bestimmten, fachspezifisch definierbaren Inhalten im Hintergrund-Betrieb angewendet werden, insbesondere für d. Auch hier existieren bereits Ansätze.

Soweit irgend möglich, sollten die WWW-Dokumente in deutsch und englisch angeboten werden.

Beschreibung der am Ende auslieferbaren Ergebnisse

Alle während der Projektzeit gesammelten Daten werden als Datenbanken mit Recherchemöglichkeit im WWW angeboten. Sämtliche im Rahmen des Projekts entwickelten Werkzeuge und Programme werden mit Dokumentation auf dem FTP-Server zur weiteren Nutzung freigegeben, ebenso die in a geprüften Public-Domain-Programme; Copyrights sind zu beachten. Über die Ergebnisse der in den "Konzeptionellen Überlegungen" erfolgten Bemühungen wird öffentlich berichtet.

Pilotnutzung

Eine Pilotnutzung durch den Fachbereich Chemie der FU soll nach dem Aufbau der Server ab viertem Monat der Projektlaufzeit erfolgen. Die Dauer der Pilotnutzung sollte nicht zu lang sein (etwa 2 - 3 Monate), um möglichst früh eine Reaktion der allgemeinen Nutzerschaft zu erfahren, auch wenn die meisten der im Abschnitt "Projektziel" genannten Angebote noch sehr unvollständig, einige sicherlich zu diesem Zeitpunkt noch gar nicht vorhanden sein werden. Anders als bei den meisten anderen Projekten wird bei den fachspezifischen Informationszentren die Akzeptanz bei den Nutzern auch die Bildung von Schwerpunkten in der Arbeit mit bestimmen.

Nutzung der Projektergebnisse nach Projektende

Im Unterschied zu vielen anderen Projekten, die konkrete Untersuchungen zu bestimmten Fragen durchführen und deren Arbeit nach positivem Abschluß des Projekts beendet werden kann, ist die Einrichtung einer zentralen Plattform für fachspezifische Informationsangebote nur auf Dauer sinnvoll, da die meisten der im Abschnitt "Projektziel" beschriebenen Aufgaben einer ständigen Pflege und Aktualisierung bedürfen. Das Projekt sollte daher, einen erfolgreichen Abschluß und Akzeptanz bei den Benutzern vorausgesetzt, zu einer ständigen Einrichtung weiterentwickelt werden; Gespräche über eine Trägerschaft sollten mit den zuständigen Gremien (auch CIC - Computer-Information-Chemie / GDCh - Gesellschaft Deutscher Chemiker) noch während der Laufzeit des Projekts geführt werden.

back Übersicht


Inhaltlicher Hintergrund

Fachlicher Hintergrund der Projektteilnehmer

Der Fachbereich Chemie an der Freien Universität Berlin betreibt seit Ende 1992 ein Workstation-Cluster CHEMnet mit zur Zeit 85 UNIX-Workstations und ca. 130 an das Netz angeschlossenen PC's und 10 MAC's. Der Schwerpunkt bei den UNIX-Plattformen liegt bei SGI-, HP- und LINUX-Anlagen, es sind jedoch auch ein SUN-, ein IBM- sowie zwei DEC-Systeme (letztere ab 2/96) in das Cluster eingebunden.

Seit Juni 1993 wurde am Fachbereich der erste WWW-Server auf dem Gebiet der Chemie in Deutschland aufgebaut; hierüber wurde auf dem 9. CIC-Workshop in Bitterfeld 1994 vorgetragen (B. Kirste). Für diesen Server wurden bereits zahlreiche Eigenentwicklungen auf dem Gebiet der Chemie erbracht, u.a. Umrechnung von Einheiten, Molmassenberechnung, 3d-Molekülmodelle von Aminosäuren, Sicherheitsdaten von Chemikalien.

Zur Zeit wird hier auch die Liste der deutschen WWW-Server geführt; dieser Dienst soll in naher Zukunft an die ZEDAT (Rechenzentrum) der FU abgegeben werden.

Im Fachbereich werden zahlreiche Programme des Molecular Modelling und der Theoretischen Chemie intensiv genutzt, insbesondere in den Arbeitsgruppen Prof. Manz, Prof. Knapp und Prof. Saenger. Ferner ist der Fachbereich an dem Projekt "Endnutzerförderung Chemiedatenbanken" des BMBF beteiligt und hält die wichtigsten chemischen Strukturdatenbanken vor. Vor diesem Hintergrund existieren umfangreiches Wissen und Erfahrungen im Umgang mit Software-Produkten aus der Chemie und verwandten Gebieten.

Eine enge Kooperation mit dem Rechenzentrum der FU und zum Projektantrag "Referenz- und Kompetenzzentrum für Informationsdienste" ist durch sehr gute personelle Kontakte gesichert.

Kooperation mit anderen Projekten

Wie bereits im Abschnitt "Projektziel" ausgeführt, muß ein ständiger Erfahrungsaustausch mit den Projekten "Referenz- und Kompetenzzentrum für Informationsdienste", "Suchhilfen in Datenquellen" und "Lehrmaterialien" erfolgen. Selbstverständlich ist auch eine Kooperation mit den anderen fachspezifischen Projekten vorgesehen.

Wegen des starken Einflusses der Industrie in der Chemie, z.B. auf den Gebieten Datenbanken und Software, sind Kooperationen mit Projekten zu den "Rechtlichen Rahmenbedingungen für den Wissenschaftsbereich" sowie zum "Wert elektronischer Informationen" unerläßlich.

Gegenüber dem Projekt "Zugriff auf Bestände in Bibliotheken" sind die fachspezifischen Interessen zu vertreten.

Informations- und kommunikationstechnische Beschreibung

Neben der Anwendung herkömmlicher Kommunikationsdienste wird ein Schwergewicht des Projekts auf der Entwicklung und Standardisierung von Übertragungs- und Darstellungsformaten für 2d- und 3d-Informationen spezifisch chemischer Natur (chemische Strukturformeln, 3d-Strukturinformation, Oberflächen, Reaktionskinetik (Animation)) in internationaler Zusammenarbeit sowie in Kooperation mit den Datenbankherstellern liegen.

back Übersicht


Projektplanung

Kommunikationstechnische Vorleistungen

Am Fachbereich Chemie der FU Berlin sind die Workstations und PC's zur Zeit auf Basis von Ethernet vernetzt; ein FDDI-Ring stellt die Verbindung zum Rechenzentrum mit zentralem Backup-Server, zentralem Compute-Server und Chemie-Fileserver her.

In einem weiteren WAP-Antrag des Fachbereichs (Befürwortung durch die DFG liegt bereits vor) ist die schnelle Netzanbindung einiger der neu zu beschaffenden Workstations vorgesehen, ferner existiert ein Haushaltsantrag für das Jahr 1996 für die schnelle Netzanbindung vorhandener Rechner. Ob dies auf der Basis von FDDI oder von ATM geschieht (hier ist das Routing zwischen 10-12 ATM-Endgeräten bisher nicht befriedigend geklärt), wird in den kommenden Monaten entschieden werden. Auf jeden Fall kann die notwendige Hardware (FDDI-Konzentrator bzw. ATM-Switch) vom Fachbereich zur Verfügung gestellt werden. Ein 48/48-Lichtwellenleiterkabel verbindet die Gebäude des Fachbereichs untereinander sowie mit dem Rechenzentrum. Die Freie Universität Berlin wird im Frühjahr 1996 einen Anschluß an das B-WIN erhalten.

Kommunikationssoftware

WebAuthor (Fa. SGI), Netscape-Server und -Browser sowie andere grundlegende Kommunikationssoftware ist vorhanden. JAVA, JAVA-script und VRML sollen, sobald für die verwendeten Plattformen erhältlich, aus Fachbereichsmitteln beschafft werden. Weitere kommerzielle Kommunikationssoftware (z.B. Lycos) muß aus Projektmitteln beschafft werden.

Meilensteine

Die im Abschnitt "Projektziel" definierten Aufgaben lassen sich schlecht zeitlich einordnen; in der Regel wird an mehreren Arbeitspaketen parallel gearbeitet werden. Eine vorläufige zeitliche Ablaufplanung sieht vor: back Übersicht

Personelle Ausstattung

(in dieser Form nicht Bestandteil des Antrags!)

Als personelle Ausstattung für das Projekt sind zwei Stellen BAT IIa (aufgeteilt in eine ganze sowie zwei halbe Stellen) vorgesehen. Ferner ist die Stelle eines studentischen Mitarbeiters (80h/Monat) finanziert; diese Mittel können auch für Werkverträge für bestimmte, fest umrissene Aufgaben verwendet werden. Ab Anfang 1997 sind ferner zwei weitere Stellen für studentische Mitarbeiter (40h/Monat) finanziert; durch eine Haushaltssperre im Land Berlin sind diese Stellen zur Zeit nicht besetzbar.

Das Projektteam Chemie.DE:

Projektleitung

Mitarbeiter

beratend

back Übersicht

Anmerkungen

Berücksichtigung benachbarter Fachgebiete

Mit dem Fachgebiet Biochemie existiert eine enge Überschneidung in der Aufgabenstellung, zum großen Teil auch in der Methodik; auch werden oft gleiche Softwareprodukte genutzt. Zudem gibt es am Fachbereich Chemie ein Institut für Biochemie sowie einige biochemisch orientierte Arbeitsgruppen in anderen Instituten des Fachbereichs, so daß die Abdeckung dieses Faches durch einen zentralen Informationsserver Chemie logisch und sinnvoll erscheint.

Beschränkungen in der Zielsetzung

Die Nutzerschaft in der Chemie steht den neuen Medien sehr gespalten gegenüber: Im Nachwuchs, insbesondere der Studentenschaft, ist großes Interesse vorhanden, und es werden neueste Techniken sofort angenommen und genutzt. Andererseits ist die Professorenschaft und das Management in der Chemie sehr konservativ; viele Hochschullehrer benutzen noch nicht einmal e-mail zur Kommunikation. Es muß daher erstes Ziel des Projektes sein, eine möglichst breite Basis auch "gestandener" Wissenschaftler mit dem Informations-Service zu erreichen. Daher steht nicht die Adaption allerneuester Techniken, sondern leichte Bedienbarkeit des Servers, seine Effizienz und Qualität in der Informationsvermittlung im Vordergrund des Projekts.

Es werden daher kein Video-Conferencing und kaum Audio-Tools angeboten werden. Einerseits besteht kein unmittelbarer Bedarf für diese Techniken, andererseits sollen Entwicklungen, die im Rahmen anderer Projekte untersucht werden, abgewartet werden. Von neuen Techniken sind nur Video-Animationen Gegenstand des Projekts.

Bedeutung der Industrie

Im Fachgebiet Chemie hat traditionell die Industrie eine stärkere Bedeutung als in anderen naturwissenschaftlichen Fachrichtungen. Es muß daher ein wesentliches Ziel des Projekts sein, auch GDCh und große Teile der Industrie von den Möglichkeiten des Projekts zu überzeugen. Hierfür ist eine intensive Werbung zum Beispiel auf Fachtagungen notwendig. Wegen der Wichtigkeit kommerzieller Datenbanken in der Chemie muß auch die Beschäftigung mit Problemen des Copyrights und mit Formen einer elektronischen Abrechnung / Bezahlung erfolgen.

back Übersicht


Zusammenfassung

Der Fachbereich Chemie der Freien Universität Berlin beantragt Projektfördermittel des DFN zum Aufbau eines Internet-Informationsdienstes für das Fachgebiet Chemie. Im Rahmen des Projekts sollen ein WWW- und ein FTP-Server betrieben, Metaindices nach fachspezifischen Gesichtspunkten aufgebaut, chemie-spezifische Werkzeuge und Programme zur Informationsaufbereitung entwickelt sowie konzeptionelle Arbeiten geleistet werden.

back Übersicht


Wolfgang Dreißig, 1996-01-30;
Überarbeitung und HTML-Formatierung: Burkhard Kirste, 1996-08-28;
Chemie.DE Projektteam, 1997-01-30