Einige Aspekte zur Darstellung und Konvertierung wissenschaftlicher Dokumente (Online/Druck)

Burkhard Kirste
Freie Universität, 14195 Berlin, Fachbereich Chemie, Institut für Organische Chemie

Im Zeitalter der elektronischen Fachinformation ist es notwendig, wissenschaftliche Dokumente möglichst effizient in verschiedener Form präsentieren zu können: Online im World Wide Web (Internet) bzw. in einem firmeneigenen Intranet, perfekt ausgedruckt und ggf. noch in weiteren Varianten. Mit "effizient" ist gemeint, daß eine Konvertierung zwischen den verschiedenen Darbietungsformen weitgehend automatisch möglich sein sollte.

In diesem Beitrag sollen einige Möglichkeiten diskutiert werden, die heutzutage allgemein zugängliche Methoden bieten, wobei für einige Konvertierungen Eigenentwicklungen (Scripts) vorgestellt werden.

Die Aufgabenstellung erfordert prinzipiell eine "Master-Datei", die sämtliche benötigte inhaltliche Informationen und Formatierungsmerkmale ("Markup") direkt oder indirekt (über Hilfsdateien, "style sheets" u. dgl.) enthält. Stand der Technik wäre dafür der Einsatz von SGML (Standard Generalized Markup Language), für das verschiedene Parser (sgmls, nsgmls) und DTDs (Document Type Definitions) sowie Konverter frei verfügbar sind, z.B.: qwertz-DTD, linuxdoc, gf mit snafu-DTDs. Selbstverständlich sollte auch eine möglichst problemlose Einbindung von Dokumenten möglich sein, die in einem anderen populären Format vorliegen, etwa Rich Text Format (RTF, aus Microsoft Word) oder LaTeX, umgekehrt sollten diese Formate auch als Ausgabeformate zur Verfügung stehen. Ein weiterer Aspekt wäre der Import z.B. von Literaturzitaten aus Rechercheergebnissen.

Beachtung verdienen die inhärenten Limitierungen der verschiedenen Darbietungsformen. So fehlt einem gedruckten Aufsatz naturgemäß die Hypertext-Funktionalität, während andererseits die Darstellung von Sonderzeichen in HTML (Hypertext Markup Language, Sprache des World Wide Web) z.Zt. noch Probleme bereitet. Das Portable Document Format (PDF, Adobe) ist im Hinblick auf die Darstellungsmöglichkeit von Sonderzeichen leistungsfähiger als gegenwärtig HTML und bietet auch eine Hypertext-Funktionalität, es ist jedoch proprietär und kann keineswegs als Ersatz für HTML gelten.


Burkhard Kirste, 1996-10-18