Jahrzehntelang haben wir Computer mit Computern verbunden. Jetzt können wir sie mit der realen Welt verbinden.
IBM Seitentools
Eine Intensivstation für Neugeborene. Eine Boje in den Tiefen der Galway Bay. Ein Raumfahrtzentrum in Schweden. An allen drei Standorten wird Stream-Computing als leistungsfähige neue Form der Datenverarbeitung getestet. Die neue IBM Middlewareplattform InfoSphere Streams (US) kann riesige Mengen verschiedener Daten in Echtzeit erfassen und analysieren und Prognosen erstellen, mit denen Benutzer intelligentere Entscheidungen treffen können. Hinsichtlich der medizinischen Behandlung schwerkranker Frühchen, hinsichtlich des Managements eines empfindlichen Meeresökosystems und hinsichtlich der Prognose von Störungen im „Weltraumwetter“.

Einbindung in die reale Welt
Stream-Computing wurde zum ersten Mal vor mehreren Jahren auf einer IBM Global Technology Outlook-Konferenz erwähnt, bei der Wissenschaftler ihre vielversprechendsten Ideen vorbrachten. „Statt einen Computer mit einem anderen Computer zu verbinden, wird bei Stream-Computing ein Computer mit der realen Welt (also den Menschen, dem Verkehr und der Umwelt) verbunden und abgewartet, was passiert“, erklärt Nagui Halim, der Forscher, der die Stream-Computing-Initiative leitet. „Nach der Erfassung der Daten müssen sie analysiert und virtualisiert werden, um zu verstehen, was passiert. Das ist das Konzept der 'Real World Awareness' (der bewussteren Wahrnehmung der realen Welt), das zu einem der Grundprinzipien des IBM Smarter Planet wurde“, so Halim.
Gründliches Überdenken der Datenverarbeitung
Dieses neue Konzept für die Datenverarbeitung stellt die Datenanalyse auf den Kopf. Bei der herkömmlichen Datenanalyse wird ein statisches Problem in einen Speicher geladen und dann werden Abfragen zu diesem Thema gestartet. Beim Stream-Computing werden Daten während der Verarbeitung von verschiedenen Quellen erfasst. Alle Daten werden von Analysesoftware auf Servern verarbeitet, die für die Verarbeitung und Analyse optimiert sind, damit die Datenverarbeitung schneller erfolgen kann.

Beispiel: Eingehende Audiodaten werden an ein Umsetzungsprogramm gesendet, das daraus einen Textstrom erstellt. Der Text wird dann an den Aggregator gesendet, der ihn nach Themen filtert: 30 % Sportnachrichten, 70 % Börsennachrichten. Dann wird der Text zur Analyse an den nächsten Prozessor und an den übernächsten weitergeleitet, während gleichzeitig neue Daten erfasst werden. Informationen, die wichtig oder „anders“ sind, werden aus dem Datenfluss herausgefiltert, unwichtige Dinge werden als „Hintergrundrauschen“ abgeleitet.
Eine Plattform, die sich den Daten anpasst
Viele Datenbanken können zwar große Informationsmengen verarbeiten, doch InfoSphere Streams kann selbst in einem riesigen, unübersichtlichen Datenmix Analysen durchführen und in Mikrosekunden einen fortlaufenden Datenstrom mit ausgewerteten Informationen bereitstellen. Die Plattform passt sich dem Zustand und der Auslastung der Datenverarbeitungsressourcen sowie den Anforderungen der Benutzer an.
Abhängig von der Art der Workload wurden Prototypen von InfoSphere Streams im Rahmen der Forschung auf den verschiedensten Hardwarearchitekturen ausgeführt – von generischen Servern bis zu Architekturen für Sonderzwecke wie IBM Blue Gene. Fortsetzung auf Seite 2
Seite 1 | 2


