ComputerClub 2
Sitemap Kontakt
  Wolfgang Back & Wolfgang Rudolph
Suche:   Wolfgang Back & Wolfgang Rudolph
  Aktuelle Sendung
  Nächste Sendung
  Sendungsarchiv
  Downloads


SENDUNGSARCHIV

09.06.2008
Folge 112

Was versteht man unter einer redundaten Speicherung?

Die Frage ist berechtigt. Das Wort "redundant" findet man auch immer öfter. Ich habe da so einen Übersetzer namens LEO als Minianwendung laufen. Fragen wir doch einfach einmal nach.
redundant  adj.   arbeitslos  
redundant  adj.   (Brit.)   freigesetzt  
redundant  adj.   also  [ling.]   redundant  
redundant  adj.   überflüssig  
redundant  adj.   überreichlich  
redundant  adj.   überzählig  
redundant  adj.   nicht gebraucht


Das Ergebnis ist schon überraschend. Was bedeutet also eine redundante Langzeitspeicherung? Bedeutet redundant einfach redundant, wie in der dritten Zeile zu lesen ist? Die weiteren Begriffe passen auch nicht so recht. Also wollen wir uns in der Sendung belehren lassen, was eine solche Speicherung bedeutet.

Es ist eine Tatsache, dass Speicherungen auf verschiedenen Medien nicht für die Ewigkeit gedacht sind. So ist zum Beispiel der Farbfilm ein flüchtiges Medium, das nur eine gewisse Zeit seine Informationen behält. Auch die magnetischen Datenträger sind von der Verg
änglichkeit nicht verschont. So sind Festplatten und Magnetbänder nicht unendlich lange haltbar. Das Magnetfeld, das uns (zum Glück) vor kosmischer Strahlung schützt, kann aber eine Beeinflussung der magnetischen Strukturen von empfindlichen Trägermaterialien herbeiführen. Aus eigener Erfahrung weiß ich, wie der WDR darunter litt und heute noch leidet. Sendungen, die auf Band aufgezeichnet werden, verlieren über die Jahre wichtige Informationen. So waren die "Ekel Alfred" - Folgen schon fast hin, bevor man eine Neukopierung vornahm. Die kräftigen Farben des Originals hatten sich in blasse Töne verwandelt.
Nun hat jede Branche ihre eigenen Probleme. Ich kann mich noch entsinnen, dass ich einmal von der Nationalbibliothek erfuhr, wie man dort Farbbilder archiviert, die auch noch in hundert und mehr Jahren mit ihrer farbigen Information zur Verfügung stehen.  Ich kann es nicht sagen, ob es heute noch so ist: doch wahrscheinlich, denn es ist immer noch die beste Methode.
Dort werden zu archivierende Farbbilder mit viel Aufwand in drei Filterauszügen in Schwarz-Weiß gespeichert. Will man also sehen, wie der Kölner Dom 1964 ausgesehen hat, so nimmt man die drei SW - Auszüge und führt sie über Filter wieder zurück auf ein Farbbild.

Jetzt kommen wir der redundanten Speicherung von digitalen Daten schon näher. Die Verfahren sind nämlich sehr nah verwandt. Die Informationen einer Festplatte werden also nicht auf einer neuen Festplatte gespeichert, sonder ebenso als Schwarzweissinformation (Null und Eins) auf einem Film. Hier lassen sich mit Hilfe eines Lasers sehr genau Strukturen erreichen, so dass der Verbrauch von Film sich in Grenzen hält.

Dieses Problem der Langzeitspeicherung findet sich in vielen Bereichen, so dass das Verfahren, das an der PTB (Physikalisch Technischen Bundesanstalt) entwickelt wurde, große Chancen hat, einen internationalen Siegeszug anzutreten.


Prof. Dr. Siegfried Hackel, PTB Braunschweig

Wir sprechen in der Sendung mit Dr. Siegfried Hackel, Dir. & Prof.
Siegfried Hackel (* 1959) hat 1987 sein Diplom in Hochenergiephysik an der Philipps-Universität Marburg abgelegt. Von 1987 bis 1994 war er als wissenschaftlicher Mitarbeiter an der Universität Kassel im Bereich theoretische Atom- und Molekülphysik tätig, wo er 1993 promovierte. Von 1994 bis 1998 war er Leiter der Datenverarbeitungsstelle an der Bundesforschungsanstalt für Landwirtschaft (FAL) in Braunschweig. Dann war er fast drei Jahre Leiter des Hochschulrechenzentrums der Universität Bielefeld, bevor er Ende 2000 zurück nach Braunschweig zur Physikalisch-Technischen Bundesanstalt (PTB) ging, wo er Leiter des Fachbereichs Informationstechnologie wurde. In 2004 wurde er an der PTB zum Direktor und Professor ernannt.
CV.


Jedem Forscher seine eigene Suchmaschine

Manchmal entstehen Dinge, von denen man sich fragt: "Das hättest du eigentlich auch machen können." Ob jedem eine Google Suchmaschine gelungen wäre, sei dahingestellt. Obwohl man mit den Suchergebnissen durchaus zufrieden sein kann, gibt es immer wieder Leute, die von einer Suchmaschine etwas anderes verlangen. Sie möchten spezialisierter fragen und bessere Antworten bekommen.
Wenn man bei den etablierten Suchmaschinen wie Google ein Stichwort eingibt, erhält man in Sekundenschnelle Tausende von Treffern. Warum geht das so effektiv? Google arbeitet sehr schnell bei Stichwörtern, über die es viele Informationen gibt, etwa über einen Popstar. Dafür wird auch eine Menge Hardware eingesetzt. Google hat über 100 000 Computer weltweit und ein Repertoire exzellenter Techniken, um unter den vielen Informationen die guten rauszufischen.

Wenn man aber spezielles Wissen sucht, etwa als Forscher oder Journalist, über ausgefallene Hobbys oder seltene Krankheiten, erhält man nicht so viele Treffer. Dann lässt sich die Anfrage auch nicht mit wenigen Schlüsselwörtern beschreiben. Schwächen zeigen sich, wenn man ein Thema gründlich analysieren oder Diskussionen über eine gewisse Zeit verfolgen will. Auch wenn Sie schon ein relativ großes Vorwissen haben, sagen die ersten Hundert Treffer von Google oder Yahoo wahrscheinlich nichts Neues mehr. Diese Suchmaschinen sind für diese Art von Anfragen nicht entworfen.


Prof. Gerhard Weikum, Uni Saarbrücken

Gerhard Weikum (49) ist Direktor am Max-Planck-Institut für Informatik (mpii) in Saarbrücken. Er war Professor an der ETH Zürich und lehrt seit 1994 auch an der Universität Saarbrücken.

Er und sein Team entwerfen spezielle Suchmaschinen. Einmal reichern sie die Daten selbst an. Sie versuchen also, Texte, Bilder und Links genauer zu analysieren. Sie verknüpfen die Seiten mit Hintergrundwissen, untersuchen die Struktur der natürlich sprachlichen Sätze und extrahieren Fakten daraus. Auf diese Weise können die Daten besser auffindbar gemacht werden. So können auch eventuelle Mehrdeutigkeiten geklärt. Wenn etwa der Begriff „Paris“ auftaucht. Ist damit die Person aus der Ilias gemeint oder die Stadt Paris? Oder etwa Paris Hilton!

Der Nutzer kann selbst mit einbezogen werden. Nutzer geben beim Suchvorgang eine Menge Input. Sie formulieren eine Anfrage, bekommen viele Treffer und lesen die Zusammenfassungen. Dann klicken sie etwa auf Treffer Rang drei, aber nicht auf Rang eins oder zwei. Damit haben sie eine vorläufige Wertung abgegeben, die sie vielleicht später, wenn sie die ganze Seite sehen, wieder korrigieren. Ein solches Relevanz-Feedback kann man auch in expliziter Form abgeben, indem man eine Seite etwa durch fünf wichtige Schlüsselbegriffe charakterisiert.

Suchmaschinen können in Zukunft auch personalisiert werden, indem man Menschen mit speziellen Interessen, beispielsweise Wissenschaftler, Informatikstudenten oder Journalisten zusammenfasst. Wenn man weiß, welche Anfragen sie weltweit gestellt haben und welche Treffer sie unter den Top Zehn angeklickt haben, bekommt man indirekt so etwas wie „Massenverstand“. Das kann man nutzen, beispielsweise um zehn bessere Toptreffer zu berechnen. Man kann es dann auf das Individuum weiter herunterbrechen. Das System berücksichtigt, welchen Wissenshintergrund der einzelne Benutzer hat, welche Themen er bevorzugt. Eine solche personalisierte Suche kann viel bessere Resultate bringen.

Ein Engpass in einer Suchmaschine ist die inhärente Unschärfe, die in Texten steckt. Wenn Sie etwas ironisch formulieren, wird kein Rechner der Welt herausfinden, dass Sie in Wirklichkeit das Gegenteil von dem meinen, was Sie sagen. Auch beim Formulieren der Suche gibt es Ungenauigkeiten. Man will ja nicht erst lange darüber grübeln, wie man ganz präzise das Suchbedürfnis ausdrücken kann. Diese Unschärfe ist weder bei den Daten noch bei der Benutzerinformation völlig zu beseitigen. Deshalb wird es nie eine perfekte Suchmaschine geben. Auch in 100 Jahren wird man nicht erwarten können, immer – egal wie schlampig die Anfrage formuliert ist – auf den Punkt genau die gewünschten Informationen zu bekommen.

Die Software, die in dem Institut entsteht wird als „open source“ verfügbar sein. Es gibt bereits bestimmte Werkzeuge im Netz, die man gratis runterladen kann Sie sind mit der im „open source“ üblichen Nichtkommerzialisierungslizenz versehen.

Die Zukunft von Suchmaschinen wird noch Veränderungen bringen. Vielleicht wird eine Suchmaschine als solche gar nicht mehr sichtbar sein. Sie vielleicht in einer Anwendung bereits eingebettet.
Die werden vielleicht an der Oberfläche nicht mehr sichtbar, sondern in Anwendungen direkt eingebaut sein. Der Nutzer merkt möglicherweise gar nicht mehr, dass etwas gesucht wird. Zum Beispiel wird sich das Handy wie eine Art intelligenter Assistent verhalten. Sie sitzen vielleicht in einem Meeting, und das Handy analysiert die Gesichter der Teilnehmer und gibt Hintergrundinformationen über diese. Die andere Richtung ist Personalisierung. Man wird ausnutzen, dass Millionen von Menschen mit diesen Diensten interagieren. Daraus lassen sich Erkenntnisse ziehen, die dann bei der Trefferberechnung und dem Ranking von schwierigeren Abfragen berücksichtigt werden. Man kann viele spezifische Details ermitteln. Welche Anfragen hat der Nutzer gestellt, worauf hat er geklickt? Google und Yahoo sammeln bereits solche Daten. Die werden das nicht individuell auswerten, sondern für statistische Analysen ausnutzen, um vielleicht noch geschickter spezifische Werbung machen zu können. Denn im Internet kann man genau verfolgen, wie Werbung wirkt. Man kann feststellen, ob jemand etwas gekauft oder welche Produktseiten er besucht hat.

Um zu verhindern, dass der Mensch zum "Gäsernen Menschen" wird, sollte man nicht nur mit drei Giganten unter den Suchmaschinen arbeiten. Wir sollten besser Hunderte oder Tausende von Suchmaschinen haben, die untereinander ein Netzwerk aufbauen. Das reduziert das Risiko bezüglich der Privatsphäre. Jeder Wissenschaftler könnte seine eigene Suchmaschine haben. Forscher haben spezialisierte Bedürfnisse, wollen diese aber nicht alle preisgeben, auch weil sie im Wettbewerb stehen. Mit den Werkzeugen, die wir entwickeln, lässt sich kontrollieren, wie weit das eigene Verhalten für andere nutzbar gemacht werden soll.


Die Welt hat sich verändert

Wenn man ständig in einer Entwicklung gefesselt ist, dann bekommt man gar nicht so richtig mit, wie groß zum Teil die Veränderungen sind. W.R. und ich gehören ja zu einer Generation, die sehr lange internetfrei gelebt haben, da die Erfindung des www erst Mitte der 90er Jahre stattfand. Doch wenn man zurückblickt, dann erkennt man die Sprünge. Wenn man früher etwas suchte, dann bedeutete dies oft ein tagelanges Herumkramen in irgendwelchen Zeitschriften. Zwar hat man beim Blättern die eine oder andere Information wieder auffrischen können, nach der man gar nicht gesucht hat. Doch oft lief die Suche auch ins Leere.



Ich erinnere mich noch, wie schwer es war, als Hobbyelektroniker an Informationen und Datenblätter der Bauteile zu kommen. Oftmals musste man 3 Wochen warten, bis man etwas Schriftliches in die Hände bekam.

Das hat sich drastisch geändert. Wenn dann das Thema von vorher wahr wird und jeder Mensch baut sich seine eigene Suchmaschine und gleicht sie auf seine Bedürfnisse ab, dann bleibt uns wohl nichts mehr verborgen.
Doch eines gehört auch dazu: wir müssen das gewonnene Wissen auch behalten und verarbeiten können.


zurück zum Archiv
Anhören:


Audiodatstream
Multibitratestream (32/56/128 kbit/s) Mediaplayer
Download 128 Kbit/s (~27 MB)
Download 32 Kbit/s (~7 MB)
Ogg Vorbis 56 Kbit/s (~12 MB)
RSS Feed (Audiocast, letzte 5 Sendungen)
RSS Feed (Audiocast, alle Sendungen)

Druckversion Impressum Haftungsausschluss