Das Internet und die Internetdienste (Vortrag)

Priv.-Doz. Dr. Burkhard Kirste
2. Workshop im Projekt "Endnutzerförderung Chemiedatenbanken"
Frankfurt am Main, 19. Mai 1995

  1. Was ist das Internet?
  2. Internet-Dienste im Überblick
  3. Zugang zum Internet
  4. Details zu ausgewählten Internet-Diensten
    1. Electronic Mail (E-Mail, email)
    2. (anonymous) FTP
    3. World Wide Web (WWW)
  5. Zusammenfassung

Was ist das Internet?

Das Internet ist ein weltweites Computernetz mit 20 bis 30 Millionen Teilnehmern. Es hat seinen Ursprung in einem Netzwerk des US-amerikanischen Verteidigungsministeriums (ARPAnet) und wurde dann auf die amerikanischen Universitäten ausgedehnt (NSFnet). Mittlerweile sind nicht nur Bildungseinrichtungen, sondern auch kommerziell betriebene Server weltweit angeschlossen.

Es sei angemerkt, daß von der Millionenzahl der Nutzer nur ein Bruchteil alle Möglichkeiten des Internet voll nutzen kann, da hierzu ein graphikfähiges Terminal und hinreichend schnelle Datenleitungen erforderlich sind.

Jeder direkt an das Internet angeschlossene Rechner muß eine eindeutige Kennung haben, und zwar eine Internet-Adresse (IP-Nummer) und einen Internet-Namen. Beispiel:

Internet-Adresse       130.133.211.115
Internet-Name          citral.chemie.fu-berlin.de
- Maschinenname        citral
- Domäne                      chemie.fu-berlin.de
- Top-Level-Domain                             de

Als "Top-Level-Domain" wird in der Regel der ISO-Landescode benutzt, wobei z.B. "DE" für Deutschland steht.

Internet-Dienste im Überblick

Die wichtigsten Internet-Dienste sind:

E-Mail

E-Mail ist der "fundamentale" Internet-Dienst. Sie dient zunächst dem direkten Informationsaustausch zwischen Internet-Teilnehmern und ist erheblich schneller als die "gelbe Post", jedoch nicht so direkt wie ein Telefongespräch, kann aber dafür quasi die Funktion eines Anrufbeantworters mit übernehmen.

Weiterhin kann E-Mail über Mailing-Listen auch dem Informationsaustausch zwischen größeren Personengruppen dienen, und schließlich kann sie auch als Ersatz für andere Internet-Dienste wie Dateiübertragung (FTP) oder "World Wide Web" herangezogen werden.

World Wide Web (WWW)

World Wide Web ist ein weltweites, auf Hypertextdokumenten basierendes Informationssystem. Hypertextdokumente enthalten Verweise auf weitere Dokumente, die man dann durch einen Mausklick oder einen Tastendruck bequem erreichen kann.

Die Texte enthalten Formatierungsmerkmale und Schriftattribute und sind deshalb angenehm lesbar, ferner ist das System multimediafähig, das heißt, Graphiken, Bilder, Videos und Klänge können übermittelt werden.

Es ist auch ohne weiters möglich, WWW-Dokumente über ein nicht-graphikfähiges Textterminal zu lesen.

Gopher

Gopher ist wie WWW ebenfalls ein verteiltes Informationssystem, das die weltweite Anfrage von Texten, Bilddaten und anderen Dateien gestattet. Hypertextfunktionalität wie beim WWW steht allerdings nicht zur Verfügung.

Net News (Usenet News)

Die Net News sind gewissermaßen eine Erweiterung des Konzepts der Mailing-Listen zu einem internationalen Kommunikationsdienst. Es handelt sich um ein großes Diskussionsforum, das in viele verschiedene Rubriken unterteilt ist, die sogenannten Newsgruppen. Diese sind vergleichbar den Leserbriefspalten von Zeitschriften. Jeder Teilnehmer kann die Mitteilungen und Meinungen lesen, die dort hingesandt wurden, und mit eigenen Hinweisen oder Kommentaren darauf antworten ("posten").

Voraussetzungen: Zugriff auf einen Rechner, der die "News" abonniert; Software zum Lesen und "Posten" (z.B. nn, tin).

Ein Beispiel für eine Newsgruppe, die das Fachgebiet der Chemie betrifft, ist sci.chem , oder für Informationssysteme de.comp.infosystems .

Spezielles Aufrufbeispiel: nn -xX sci.chem

(anonymous) FTP (File Transfer Protocol)

Das Dateiübertragungsprotokoll bzw. -programm FTP dient zum Austausch beliebiger Dateien, und zwar sowohl von Textdateien als auch von Binärdateien, d.h. z.B. lauffähigen Computerprogrammen oder Bilddaten.

Im Internet steht eine riesige Menge derartiger Dateien zur Verfügung. Viele Computerprogramme werden als "Public Domain"-Programme kostenfrei angeboten, bei den sogenannten Shareware-Programmen erwartet der Autor nach Ablauf einer Probezeit ein gewisses finanzielles Entgelt. Das Kopieren derartiger Dateien von einem sogenannten "anonymen" FTP-Server ist ohne weiteres möglich.

Telnet

Telnet ermöglicht das interaktive Arbeiten an einem entfernten Rechner über eine Terminalemulation. Als Informationsdienst wird es insbesondere zur Abfrage von Bibliothekskatalogen genutzt.

Weitere Dienste

Das WAIS-System (Wide Area Information Servers) ist ein Datenbanksystem, das zum Auffinden von Informationen über ein Computer-Netzwerk dient.

Hyper-G ist gewissermaßen eine Weiterentwicklung des World-Wide-Konzepts. Vorteilhaft ist z.B. eine bessere Indizierbarkeit mit Vor- und Rückwärtsverweisen, nachteilig sind eine für den Anwender schwer durchschaubare Informationsstruktur und eine begrenzte "Skalierbarkeit", d.h., die Anzahl der miteinander kooperierenden Server stößt an praktische Grenzen.

IRC (Internet Relay Chat) ist ein weltweites Konferenzsystem zum "Quatschen".

"finger" liefert einige Informationen über Benutzer von Unix-Workstations. Über eine Datei namens .plan ist damit auch der Abruf von Informationstexten möglich.

Zugang zum Internet

An deutschen Hochschulen sind zumindest die Rechenzentren über das Wissenschaftsnetz (WIN) mit dem Internet verbunden. In wachsendem Umfang werden auch Universitätsinstitute "verkabelt", d.h., sie sind über Ethernet oder gar über ein modernes Hochgeschwindigkeitsnetz wie FDDI (Fiber Distributed Data Interface) oder ATM (Asynchronous Transfer Mode) über das TCP/IP-Protokoll (Transmission Control Protocol/Internet Protocol) mit dem Campus-Netz und folglich mit dem Internet verbunden.

Wenn kein direkter Netzwerkanschluß verfügbar ist, z.B. in der Privatwohnung, kann man sich über ein Hochgeschwindigkeitsmodem und das Telefonnetz oder über ISDN (Integrated Services Digital Network, 64 KBit/s) unter Vermittlung eines Netzwerkanbieters in das Internet einwählen. Als Universitätsangehöriger kann man sich in der Regel an das Universitätsrechenzentrum wenden, anderenfalls an einen der zahlreichen kommerziellen Netzwerkanbieter.

Beim Zugang über ein Modem sind zwei Fälle zu unterscheiden: zum einen die einfache Einwahl über ein Terminalprogramm in einen Rechner, der seinerseits an das Internet angeschlossen ist, zum anderen eine SLIP- (Serial Line Internet Protocol) oder PPP-Verbindung (Point-to-Point Protocol). Im ersteren Fall ("Shell Account") ist man im wesentlichen auf nichtgraphische Anwendungen beschränkt, während im letzteren Fall prinzipiell die volle Nutzung der Internet-Dienste einschließlich graphischer Ausgabe möglich ist. (SLIP und PPP unterscheiden sich durch das verwendete Protokoll, z.B. die Art der Fehlerkorrektur.)

Für den Bereich der Freien Universität Berlin stehen sowohl Dokumentation als auch Software zum Anschluß eines PCs (unter Windows 3.1) über SLIP an das Rechenzentrum zur Verfügung; eine Übertragung auf andere Universitäten ist allerdings nicht ohne weiteres möglich.

Details zu ausgewählten Internet-Diensten

Electronic Mail (E-Mail, email)

Elektronische Post, meist Electronic Mail oder E-Mail genannt, dient zum Verschicken von Briefen über Computernetze. Es handelt sich um den bekanntesten und am meisten genutzten Kommunikationsdienst auf Rechnersystemen, über den weltweit -zig Millionen Teilnehmer, insbesondere Universitätsangehörige, erreichbar sind. E-Mail bietet gegenüber der klassischen Kommunikation mit Hilfe der "gelben Post" einige Vorteile: sie ist sehr schnell, preiswert und einfach handhabbar.

E-Mail ist nicht auf das Internet beschränkt. Es gibt Schaltstellen (Gateways) zu anderen E-Mail-Netzen wie z.B. BITNET, EAN, CompuServe.

Zum Verschicken einer E-Mail ist die exakte Kenntnis der Zieladresse des Empfängers notwendig. Die Adresse muß in einer speziellen Form angegeben werden; weder Tippfehler noch Auslassungen werden verziehen, es erfolgt keine automatische Korrektur.

Eine E-Mail-Adresse im Internet sieht beispielsweise wie folgt aus:

     schulze@physik.uni-heidelberg.de

Mit dieser Adresse würde man den (hypothetischen!) Benutzer Schulze an einem Computer des Fachbereichs Physik der Universität Heidelberg in Deutschland erreichen. Es sei angemerkt, daß es in Deutschland kein umfassendes Verzeichnis der Internet-Mail-Adressen gibt. Es existieren lediglich einige Teillösungen, wie z.B. eine Liste der GDCh-Mitglieder mit E-Mail-Adresse; Anmeldungen an webmastr@ccc.uni-erlangen.de .

Es sei angemerkt, daß das E-Mail-System auf mehreren Komponenten beruht: erstens dem Benutzerprogramm, das u.a. dem Lesen und Schreiben einer E-Mail dient, zweitens dem Transportprogramm, das in Analogie zur Post die Beförderung und Zustellung übernimmt (z.B. sendmail, smail), drittens dem Kommunikationsprotokoll zwischen den Rechnern (z.B. SMTP).

Eine E-Mail besteht aus einem Kopf (Header) und einem Hauptteil (Body).

   To: schulze@physik.uni-heidelberg.de
   Subject: Treffen am Donnerstag

Die wichtigsten Kopfzeilen sind "To:" mit der Adresse und "Subject:" mit einer Themenangabe. Eingehende E-Mail enthält u.a. noch eine "From:"-Zeile mit der Absenderangabe.

Der Textkörper kann beliebigen ("ASCII"-) Text enthalten. Angemerkt sei, daß die Verwendung deutscher Umlaute Probleme bereiten kann, da es verschiedene Codierungen gibt, die beim Empfänger nicht unbedingt richtig ankommen bzw. umgesetzt werden.

Typische E-Mail-Benutzerprogramme haben etwa folgenden Leistungsumfang: Selektives Lesen eingegangener E-Mails, Archivieren, Export, Drucken, Beantworten (reply), Weiterschicken (forward) und Löschen; Schreiben eigener E-Mails (compose), ggf. unter Verwendung vorgefertigter Texte und, wenn gewünscht, mit Kopie (Cc:) an weitere Adressaten.

E-Mail-Benutzerprogramme gibt es für verschiedene Plattformen wie z.B. Unix-Workstations (pine, elm, zmail, xmail), Intel-PCs (pmail = Pegasus Mail), Apple Macintosh etc.

Mailing Lists

Maillisten dienen dem Informationsaustausch innerhalb von Gruppen von Leuten mit einem gemeinsamen Interessengebiet. Um daran teilnehmen zu können, muß man sich zunächst beim Listenverwalter anmelden, z.B. für die Liste der Projektleiter im Programm "Endnutzerförderung Chemiedatenbanken":

Formlose E-Mail an:

   chemie-db-request@chemie.fu-berlin.de

Mitteilungen an alle Teilnehmer per E-Mail an:

   chemie-db@chemie.fu-berlin.de

Oder die Mailliste der GDCh-Fachgruppe Chemie-Information-Computer (CIC):

Mail an:
   Majordomo@ccc.uni-erlangen.de
Im Hauptteil:
   subscribe gdch-cic

(anonymous) FTP

Das File Transfer Protocol (FTP) dient dem Transport von Dateien im Internet. Diese Dateien können Programme, Daten oder auch Informationstexte enthalten. Besonders wichtig ist die anonyme Variante, die jedem Internetteilnehmer den Zugriff auf sogenannte FTP-Server erlaubt. Zu deren Benutzung gibt man als Benutzernamen (User) anonymous oder ftp ein, als Paßwort die eigene E-Mail-Adresse, also z.B. schulze@physik.uni-heidelberg.de.

Man beachte, daß nur reine Texte wie README im ascii-Modus transferiert werden dürfen. Programme (binaries) und alle gepackten Archive müssen im binary-Modus übertragen werden. Gepackte bzw. komprimierte Archive müssen anschließend entpackt bzw. dekomprimiert werden.

Beispiel einer FTP-Sitzung:

ftp ftp.fu-berlin.de
220 FTP.FU-Berlin.DE ready, please login as user "ftp".
Name (ftp.fu-berlin.de:schulze): ftp
331 Anonymous login ok, send your e-mail address as password.
Password: schulze@physik.uni-heidelberg.de
ftp> cd pub
ftp> dir
...
ftp> get README
ftp> binary
ftp> get INDEX.gz
ftp> quote site index mosaic
...
ftp> help
...
ftp> quit

Bevor große Datenmengen von einem entfernten FTP-Server geholt werden, sollte man unbedingt prüfen, ob die Datei evtl. auf einem nahegelegenen Server vorhanden ist. Zur Suche nach Dateien auf FTP-Servern empfiehlt sich ein Dienst namens Archie.

World Wide Web (WWW)

Zur Benutzung des weltweiten Hypertext-Informationssystems "World Wide Web" (WWW, W3) benötigt man einen Internetzugang und ein Benutzerprogramm, einen sogenannten Browser. Ersatzweise ist es auch möglich, WWW-Dokumente per E-Mail zu bestellen oder über Telnet einen Zugang zu erhalten, siehe WWW - Getting Started:

Telnet-Beispiel

telnet login.fh-wolfenbuettel.de
   login: webinfo

E-Mail-Beispiel

Man muß den "URL", das ist die genaue Adresse des gewünschten Dokuments, kennen. "send URL" schickt den Text im ASCII-Textformat, "source URL" hingegen im Hypertext-Quellformat (HTML).

E-Mail schicken an:

   agora@mail.w3.org
Subject: frei lassen; im Hauptteil:
   send http://www.chemie.fu-berlin.de/outerspace/www-info.html
   source http://www.chemie.fu-berlin.de/outerspace/www-info.html

Browser

In dem obengenannten Telnet-Beispiel zur Fachhochschule Wolfenbüttel wurde letzten Endes der bekannte WWW-Textmodus-Browser lynx aufgerufen, der die Nutzung dieses Informationsdienstes auch über ein nicht-graphikfähiges Terminal gestattet.

Populär wurde WWW insbesondere durch den graphikfähigen Browser Mosaic; heutzutage bevorzugen viele Benutzer den Browser Netscape. Jedenfalls gibt es mittlerweile WWW-Browser für alle gängigen Computersysteme wie Unix-Workstations, Intel-PCs und Apple Macintosh.

Die Benutzung dieses Informationssystems ist prinzipiell kinderleicht. Um einem Verweis zu folgen, braucht man nur ein markiertes Wort oder Symbol einmal mit der Maus anzuklicken. Die Markierung wird z.B. durch blaue Farbgebung und Unterstreichung kenntlich gemacht. Die Sprünge sind im WWW zwar nur in einer Richtung möglich, die Browser gestatten aber auch den Rücksprung zum letzten Dokument oder eine Navigation innerhalb von "History" oder "Hotlist". Das WWW-System bietet volle Multimedia-Unterstützung wie Graphik, Bilder, Ton und Video.

WWW-Grundlagen: HTML und URLs

Zur Abfassung von Hypertext-Dokumenten bedient man sich der "HyperText Markup Language" HTML. Diese auf SGML basierende Dokument-Definition legt allerdings nur die Struktur des Dokuments fest. Im Gegensatz zu PostScript werden keine Festlegungen über den Seitenaufbau oder die zu verwendenden Schriftarten getroffen. Im wesentlichen handelt es sich schlicht um ASCII-Texte. Formatierungsmerkmale werden durch sog. "Tags" eingeführt, die stets in spitze Klammern eingeschlossen sind. Beispielsweise kennzeichnet man mit dem <B>-"Tag" Passagen, die im Fettdruck erscheinen sollen.

Von fundamentaler Bedeutung sind nun die mit dem Buchstaben A gekennzeichneten Anker, mit denen Verweise eingefügt werden. Der Verweis steht neben dem Schlüsselwort HREF. Wie bereits erwähnt, kann es sich dabei um einen neuen Text, eine bestimmte Textstelle, ein Bild, ein Klangobjekt oder einen Videoclip handeln. Die Syntax ist in allen Fällen die gleiche, die Unterscheidung erfolgt anhand der Dateierweiterung; z.B. html, gif, au oder mpeg.

Um nun Dokumente weltweit eindeutig adressieren zu können, wurde das Konzept des Uniform Resource Locators, kurz URL, eingeführt. Der URL spezifiziert zunächst das Protokoll, dann den Internet-Namen des Servers und schließlich den Dateinamen mit der Pfadangabe. WWW-Server arbeiten mit dem HTTP-Protokoll, was für "HyperText Transfer Protocol" steht. Das WWW-Konzept umfaßt jedoch darüber hinaus auch praktisch alle anderen Internet-Dienste wie Gopher, FTP, Telnet und WAIS.

Einsatzmöglichkeiten in der Chemie

sind vielfältig:

Mit Hilfe des WWW kann man Informationen über eine Institution verbreiten, wie z.B. den Fachbereich der Chemie der Freien Universität Berlin. Auch Vorträge lassen sich ankündigen, wie z.B. Institutskolloquien oder die Vorträge im GDCh-Ortsverband.

Das WWW eignet sich auch bestens für die Online-Dokumentation von Software. Als Beispiel ist hier der Anfang der Dokumentation zu MolScript gezeigt. Wie man sieht, lassen sich ohne weiters Graphiken oder Bilder integrieren, und die Texte lassen sich wesentlich angenehmer lesen als z.B. Unix "man pages". Auch Lehrmaterialien zur Chemie können über das WWW angeboten werden, wobei mit Hilfe von Formularen oder anklickbaren Diagrammen auch interaktive Tests durchgeführt werden können.

Ein gegenwärtig heiß diskutiertes Thema ist das Gebiet des "Electronic Publishing". Das WWW-System eignet sich bestens dazu, wissenschaftliche Ergebnisse ohne Verzögerung zu verbreiten. Preprints können auf einem WWW-Server angeboten werden; am angenehmsten für den Leser ist es, wenn das gesamte Dokument im Hypertext-Format, auch mit Abbildungen, zur Verfügung gestellt wird. Hierfür gibt es von mir selbst, von Henry Rzepa und anderen bereits Beispiele. Alternativ ist es aber auch möglich, nur das Abstract samt einem Verweis auf das PostScript-Dokument anzubieten; das Dokument kann dann ggf. vom Leser "heruntergeladen" werden.

Die Zeitschrift Chemical Physics beispielsweise bietet bereits einen derartigen Preview-Service. Hypertext-Abstracts können "online" gelesen werden, und das vollständige Dokument läßt sich ohne weiteres "herunterladen". Die Zeitschriften J. Am. Chem. Soc. und Chem. Rev. stellen ergänzendes Material auf dem ACS WWW-Server zur Verfügung. Der Springer-Verlag stellt Inhaltsübersichten kostenfrei zur Verfügung, Preprints gegen Entgelt. Insbesondere im Bereich der Mathematik gibt es bereits einige echte elektronische Zeitschriften.

Selbstverständlich wirft diese Form des "Electronic Publishing" auch diverse Fragen auf, wie Copyright-Probleme, Authentizität der Dokumente, patentrechtliche Probleme und Gebührenerhebung.

Neben Veröffentlichungen stellen Konferenzen ein bedeutendes Forum zum Austausch wissenschaftlicher Informationen dar. Auch hier gibt es bereits elektronische Konferenzen mittels WWW.

Die Möglichkeiten des WWW beschränken sich nicht auf das Anbieten "realer" Hypertext-Dokumente, sondern mit Hilfe von suchbaren Indizes, von Formularen und von anklickbaren Karten ist ein interaktiver Dialog mit dem Benutzer möglich, der z.B. für Datenbankabfragen genutzt werden kann.

Ein Beispiel dafür ist unsere Gefahrstoffdatenbank für Chemikalien. In diesem Fall haben wir ein CGI-Skript sowie ein spezielles Datenbankprogramm entwickelt, das eine HTML-Ausgabe mit weiteren Verweisen bietet. So erhält man Erklärungen zu den R- und S-Sätzen, wenn man die betreffende Codierung anklickt. Als weiteres wichtiges Beispiel sei erwähnt, daß es Formulare zur Abfrage der Brookhaven Protein-Datenbank (PDB) gibt. Allmählich steigt auch die Anzahl der Bibliothekskataloge, in denen man mit Hilfe von WWW-Formularen recherchieren kann; zuvor gab es dafür allenfalls unpraktische Möglichkeiten per "Telnet".

Betrachter wie beispielsweise "Mosaic" sind dazu in der Lage, externe Betrachtungsprogramme für verschiedenartige Anwendungen zu starten. Diese Idee wurde von Henry Rzepa aufgegriffen und für die Bedürfnisse der Chemie erweitert. So erhält man beim Anklicken eines 3D-Molekülmodells bei korrekter Installation der MIME-Erweiterung nicht etwa ein vergrößertes statisches Bild, sondern statt dessen werden die Molekülkoordinaten an ein Molekülgraphik-Programm wie "xmol" oder "rasmol" übergeben. Im Beispiel handelt es sich um Pinen; der Benutzer kann jetzt z.B. das Molekülmodell beliebig drehen. Auch Animationen etwa von Reaktionsabläufen oder Molekülschwingungen lassen sich mittels "xmol" darstellen. Inzwischen wurde die Idee auch andernorts aufgegriffen, beispielsweise an der Uni Oldenburg und der Uni Erlangen.

Eine andere Erweiterung betrifft Spektren oder Chromatogramme. Beispielsweise ist es nützlich, wenn man einen Ausschnitt aus einem NMR-Spektrum vergrößert betrachten kann. Eine einfache Ausschnittsvergrößerung einer Pixelgraphik ist dafür allerdings nicht hilfreich. Sinnvoll ist hingegen die Übergabe von x,y-Wertepaaren an ein geeignetes Graphikprogramm wie "xmgr" oder "xgraph".

Zusammenfassung

Internet:
ein weltweites Computernetz mit 20 bis 30 Millionen Teilnehmern
E-Mail:
direkter "brieflicher" Informationsaustausch
Maillisten
Ersatz für andere Dienste (FTP-Mail, WWW per Mail)
Net News:
in viele Rubriken (Newsgruppen) unterteiltes großes Diskussionsforum
Telnet:
interaktives Arbeiten an entfernten Rechnern
FTP:
Dateiübertragung
"anonymous" FTP-Server
Archie dient zur Suche
World Wide Web (WWW):
weltweites verteiltes Informationssystem
Hypertext und Multimedia-Unterstützung
Mai 1995: über 23000 WWW-Server, über 3.6 Millionen WWW-Dokumente


Burkhard Kirste, 1995/05/16