Zum Hauptinhalt

Big Data

Mit Simulationen in Echtzeit zu Entscheidungen
Von Lukas Huggenberg

Gigantische Mengen unstrukturierter Daten in Echtzeit analysieren, mit den Erkenntnissen experimentieren, die Ergebnisse der Simulationen visualisieren und daraus Entscheidungen ableiten. Das braucht Speicher, Software, Rechner und vor allem Grips.

Sie stammen aus Warenwirtschaftssystemen und Finanztransaktionen, von vernetzten Sensoren in Dingen und draussen in der Natur, von GPS-Geräten, Satelliten und Radioteleskopen. Es sind Textdaten von Blogs, Twitter und Facebook, Bild-, Audio- und Videodaten von Flickr, iTunes und Youtube. Logdateien von Webservern zeichnen Datenspuren auf, auch „exhaust data“ genannt – „Datenabgas“.

Die Verkehrsleitzentrale der Polizei in einer Grossstadt steuert den Verkehrsfluss, indem sie fortlaufend die Daten von Sensoren und Überwachungskameras auswertet.

Kurzum: Die oft zitierte Datenflut besteht aus gigantischen Mengen von Daten (Volume), die in unstrukturierter, vielfältiger Form vorliegen (Variety), mit hoher Geschwindigkeit anfallen und fortlaufend verarbeitet werden müssen (Velocity). Diese Daten können nicht in den Datenbankfeldern eines Data Warehouse gespeichert und darum nicht rückblickend durch Data Mining analysiert werden. Nimmt man ihnen den Schrecken der Flut, werden sie als V3-Daten, neudeutsch als Big Data bezeichnet.


  • - CollapseDaten sind Öl – oder Humus

    Eine verbreitete Redensart lautet, Daten seien das neue Öl – ein Rohstoff, der ausgebeutet werden könne. Der auf die Visualisierung von Daten spezialisierte britische Journalist David McCandless ändert die Metapher leicht ab und macht oil zu soil: Daten seien Humus, eine auf den ersten Blick amorphe Materie, die durch kreatives Umgraben zu einem fruchtbaren Boden für aufblühende Visualisierungen von Erkenntnissen werde. Um aus Big Data schnell, oft sogar in Echtzeit, spezifische Informationen zu gewinnen, kommt unkonventionelle Analysesoftware zum Einsatz, die hohe Rechenleistung und neuste Speichertechnik voraussetzt (siehe Kasten auf Seite 15). Dabei werden unter Verwendung von Algorithmen Simulationen unterschiedlicher Vorgehensweisen durchgeführt und so Grundlagen für Entscheidungen gewonnen.

    Von Experimenten zu Modellen
    Simulieren und kontrolliert experimentell auswerten, Modelle synthetisieren, Hypothesen testen, Ursachen von Abhängigkeiten unterscheiden: Aus Daten gewonnene Erkenntnisse geben Organisationen und Unternehmen bessere Steuerungsinstrumente in die Hand.

    Zum Beispiel: Die urbane Dynamik verstehen
    Für Visualisierungen zum besseren Verständnis der urbanen Dynamik aggregiert das SENSEable City Lab des MIT Daten von Mobiltelefonen, Bussen und Taxis. So erhalten Bürger und Passanten kurzfristig brauchbarere Informationen über ihr unmittelbares Umfeld. Langfristig verhilft die Analyse der Daten dem städtischen Organismus zu mehr Effizienz.


  • - CollapseDaten als Produktionsfaktor

    Daten sind heute global und in allen Branchen ein Produktionsfaktor – genau wie Rohstoffe oder Humankapital. Wirtschaftliche Aktivität ohne Datenverarbeitung ist undenkbar. Die täglich anfallende Datenmenge ist aber bereits so gross, dass sie physikalisch gar nicht mehr gespeichert werden kann.

    Das Spital bietet eine Patientin zu einem Kontrolluntersuch auf, weil die Daten eines Sensors, den sie auf sich trägt, auf eine negative Entwicklung eines Messwerts hinweisen.

    Bisher waren es vor allem die hochentwickelten Volkswirtschaften der westlichen Welt, die sich Big Data am erfolgreichsten nutzbar machten. Etablierte Unternehmen tun sich im Gegensatz zu Startups allerdings oft schwer damit, die Chancen zu erkennen, die mit der Digitalisierung des Alltags und den daraus anfallenden Daten verbunden sind. Mittlerweile verfügen jedoch auch die Schwellenländer über viel Potenzial, Daten in wirtschaftlichen Erfolg umzumünzen. Wichtige Treiber dafür sind die enorme Verbreitung der mobilen Kommunikation und die grosse Zahl gut ausgebildeter Fachkräfte.

    Regeln für die Entscheidungsfindung
    Rechtzeitig Erkenntnisse gewinnen, diese deuten und verstehen und geeignete Massnahmen ergreifen: Mittels automatisierter Algorithmen analysierte und aufbereitete Daten unterstützen die Entscheidungsfindung und reduzieren das Risiko von Fehlentscheiden.

    Zum Beispiel: Offengelegte Kriminalstatistik
    Ob Fragen zu Trends und Mustern oder zu lokalen Vorfällen: Crimespotting gibt Antworten auf Fragen wie „Wurden diesen Monat mehr Raubüberfälle verübt als im vergangenen?“, oder „Wohne ich in einem Stadtteil, in dem besonders viele Morde verübt werden?“. Eine klare Sicht auf das, was wirklich geschieht, ist die Basis für eine gut informierte Bewohnerschaft und eine verlässliche Verwaltung.


  • - CollapseDaten als Wertschöpfungsfaktor

    Daten spielen eine fundamentale Rolle bei der Wertschöpfung. Gleichzeitig wird ihre Auswertung immer aufwendiger. Unternehmen müssen darauf reagieren und ihre Geschäftsprozesse entsprechend anpassen. Davon ist nicht zuletzt auch das Marketing betroffen (siehe auch Seite 15). Und sie müssen lernen, dass ihnen für ihre Zwecke interessante Daten oft nicht exklusiv zur Verfügung stehen.

    Der Kundendienst des Kreditkartenherausgebers sperrt automatisch jede Karte, bei der aufgrund von in Echtzeit überprüften Transaktionsdaten ein Betrugsverdacht aufkommt.

    Kleine, agile Datenbroker sind längst nicht mehr nur in einer Nische tätig, sondern Teil der Wertschöpfungskette von Big Data. Sie können als Dienstleister fehlendes Know-how und interne Ressourcen kompensieren. Und letztlich sind es die Datenlieferanten selbst – die Kunden –, die in den sozialen Netzen Qualität und Preise vergleichen und Dienstleistern und Herstellern so die Grundlagen für Angebote mit grösserer Wertschöpfung verschaffen. Um auch aus immer grösseren Datenmengen Wertschöpfung zu generieren, investieren Unternehmen und Organisationen zunehmend in fünf relativ einfach zu verwirklichende Lösungen und setzen auch damit verbundene nötige Reorganisationen um.

    Transparente Datenbereitstellung
    Such- und Verarbeitungszeiten werden massiv reduziert, wenn beispielsweise die verschiedenen Abteilungen der öffentlichen Verwaltung auf getrennt gesammelte Daten einfacher und schneller Zugriff erhalten. In der produzierenden Industrie lassen sich Doppelspurigkeiten vermeiden und die Markteinführung beschleunigen, indem Forschung, Entwicklung, Produktion und Marketing vom gängigen Silodenken Abschied nehmen und sich ihre Daten gegenseitig zugänglich machen.

    Daten als Experimentierfeld Ob Lagerbestand oder Krankheitstage, ob als Parameter beeinflussbar oder nicht: Eine mit kontrollierten Simulationen vorgenommene Auswertung von Daten in Echtzeit liefert Erkenntnisse zu den Ursachen von Schwankungen des Geschäftserfolgs und gibt der Unternehmensleitung bessere Steuerungsinstrumente in die Hand. Informationen werden kontinuierlich analysiert, zu neuen Modellen synthetisiert und stehen augenblicklich der gesamten Organisation zur Verfügung: Vom Leitstand des Hochregallagers bis ins Büro des Finanzvorstands. Hypothesen können getestet und Ursachen von Abhängigkeiten unterschieden werden.

    Ein Dienstleister stellt aufgrund von auf Facebook geposteter und via Twitter versandter Kritik fest, dass sein Kundendienst zunehmend negativ beurteilt wird.

    Im wissenschaftlichen Umfeld wird im Rahmen des Projekts FuturICT am Aufbau des Living Earth Simulator gearbeitet, einer Kombination aus Supercomputern und Krisenobservatorien, mit deren Hilfe Entscheidungsträger wissenschaftlich fundierte Massnahmen in die Hand bekommen sollen, wenn in den Finanzmärkten, in der Umwelt oder in der Gesellschaft Krisensituationen entstehen.

    Zielgruppenspezifische Segmentierung Massgeschneiderte Produkte und Dienstleistungen kommen im Marketing und im Risikomanagement bereits breit zum Einsatz. Die Segmentierung wird mit der Analyse von Big Data laufend spezifischer, die für die Auswertung benötigte Zeit immer kürzer und damit die zielgruppenspezifische Ansprache umso effektiver. Diese Vorteile werden zunehmend auch vom öffentlichen Sektor erkannt, der bisher die Bürgerinnen und Bürger ohne zu differenzieren anspricht.

    Ärzte stellen die Diagnose schneller und exakter, wenn ihnen Hypothesen zur Verfügung stehen, die automatisch aufgrund der Wechselbeziehungen von Messwerten aufbereitet wurden.

    Werkzeuge für die Entscheidungsfindung Wird die Datenanalyse auf der Basis von automatisierten Algorithmen durchgeführt, unterstützen die Resultate die Entscheidungsfindung der damit betrauten Personen. So wird das Risiko reduziert, dass sie ungeeignete Massnahmen ergreifen, und es kommen Erkenntnisse zustande, die mit herkömmlichen Analyseverfahren nicht rechtzeitig oder gar nicht aufgedeckt werden. Ob es sich um Daten von Kunden oder um solche von in Produkten enthaltenen Sensoren handelt: Erst eine automatisierte Aufbereitung und Visualisierung ermöglicht es oft, ihre Auswertung überhaupt zu deuten und zu verstehen.

    Verbesserte Angebote und neue Geschäftsmodelle Aus Big Data gewonnene Erkenntnisse ermöglichen Unternehmen, bestehende Angebote zu verbessern und neue Geschäftsmodelle zu lancieren. Die produzierende Industrie nutzt beispielsweise die beim Gebrauch ihrer Produkte durch die Konsumenten in den sozialen Medien abgegebenen Beurteilungen für die Entwicklung der nächsten Produktgeneration und für den Aufbau neuer Dienstleistungen zur Kundenbindung. Newsfeeds, Tweets, Facebook-Postings und Blogs werden mithilfe der Textanalyse – in diesem Fall Stimmungsanalyse (Sentiment Analysis) genannt – daraufhin untersucht, was und wie von den Verfassern der Mitteilungen über die Qualität eines Produkts oder des Kundendiensts geschrieben wird.

    Ein Onlinehändler analysiert kontinuierlich die Abfolge der Mausklicks auf seinen Bestellseiten und personalisiert für jeden Kunden die Platzierung von passenden Sonderangeboten.


  • - CollapseNeue Firmen und Dienstleistungen

    Die Fähigkeit, Big Data gewinnbringend zu nutzen, wird zunehmend zu einem zentralen Element des Wettbewerbs und des Wachstums. Es entstehen neue Firmen, die sich in frei zugängliche Datenströme einklinken und mit völlig neuen Dienstleistungen aufwarten. Besonders erfolgreich agieren jetzt schon die Aggregatoren: Spezialisten, die nichts anderes tun, als Daten aus unterschiedlichen Quellen zusammenzutragen, auszuwerten und mit Analyseresultaten versehen weiterzuverkaufen. So gründete ein internationales Transportunternehmen eine Tochterfirma, die aus den im Tagesgeschäft des globalen Warenverkehrs anfallenden Daten spezifische Informationen extrahiert und diese an Kunden verkauft, die Wirtschaftsprognosen erstellen.


    Produktiver und zufriedener
    Mit der Auswertung von Big Data lässt sich auch eine Steigerung der Produktivität und der Kundenzufriedenheit erzielen. Firmen und Organisationen agieren erfolgreicher, wenn sie Werkzeuge zur Gewinnung von Big Data in die Produkte und Dienstleistungen integrieren und sie so besser auf die Bedürfnisse der Kunden abstimmen und mit Mehrwert und Nachhaltigkeit versehen. Konsumenten und Bürger ziehen sowohl direkt als auch indirekt Nutzen aus dem Fortschritt, der auf Big Data beruht. Sie erhalten brauchbarere Produkte und Dienstleistungen und profitieren von einer transparenteren Preisgestaltung. Die Gesundheitsvorsorge wird sicherer und kostengünstiger. Aktuellere Verkehrsinformationen sparen Nerven, Zeit und Treibstoff. Gesellschaftliches Engagement wirkt sich unmittelbarer aus.

    Die sozialen Medien als Echoraum
    Immer spezifischere Segmente in immer kürzerer Zeit immer effektiver ansprechen: Mit Social Listening und Sentiment Analysis lassen sich aus Daten die dafür benötigten Erkenntnisse gewinnen. Mit IBM Cognos Customer Insight stehen die Werkzeuge zur Verfügung.

    Zum Beispiel: Publikum unter Beobachtung
    Wenn von der global twitternden Gemeinschaft eine Werbe- oder Marketingaktion besonders intensiv diskutiert wird, kann dies der Reputation eines Unternehmens Schaden zufügen – oder Nutzen bringen. In beiden Fällen hilft die fortlaufende Beobachtung der Entwicklung der Diskussion dabei, rechtzeitig angemessene Massnahmen zu ergreifen.


  • - CollapseHürden und Potenziale

    Das Potenzial, durch die Nutzung von Big Data den Unternehmenswert zu steigern, findet sich in sämtlichen Branchen. Firmen und Organisationen müssen aber verbreitet technische und strukturelle Hürden abbauen und in den Aufbau von Know-how investieren. Eine Studie des McKinsey Global Institute bemängelt denn auch, dass weltweit angesichts einer jährlichen Zuwachsrate von 40 Prozent bei der Datenmenge gerade einmal 5 Prozent mehr Ausgaben für IT geplant sind. Dem Fortschritt steht zudem ein eklatanter Mangel an Fachkräften im Weg. Es fehlt an Spezialisten mit umfassendem Wissen über Statistik und lernende Systeme und an Entscheidungsträgern, die wissen, wie eine Firma geführt werden muss, deren Erfolg auch auf Big Data beruht.

    Die Steuerbehörde erkennt bei der Risikobeurteilung Muster, die auf eine falsche Deklaration hindeuten, und identifiziert so potenzielle Steuersünder.

    Die Ausbildung qualifizierter Fachkräfte ist zeitintensiv; auch talentierte Leute benötigen Jahre, bis sie die erworbenen Kenntnisse produktiv einsetzen können. Die Studie von McKinsey prognostiziert allein in den USA bis 2018 einen zusätzlichen Bedarf von 140 000 bis 190 000 Datenspezialisten und 1,5 Millionen weiteren ausgebildeten Fachkräften.

    Komplikationen und Regeln
    Parallel zum laufend einfacher werdenden Zugriff auch auf sensible Daten – beispielsweise von der auf Transparenz bedachten öffentlichen Verwaltung verfügbar gemachte oder aus sozialen Netzen stammende Informationen – müssen sich Unternehmen und Organisationen neuen Regelwerken unterstellen. Es geht unter anderem darum, Fragen zur Einhaltung der Privatsphäre, zum Datenschutz, zum geistigen Eigentum und zur Haftung zu klären. Die Einhaltung der Regeln verlangt nach Zurückhaltung bei der Nutzung der aus Daten gewonnenen Erkenntnisse und steht damit oft diametral zu den möglichen Vorteilen, die dabei erzielt werden könnten.

    Autoverkäufer können Servicedienstleistungen rund um ihre Fahrzeuge präziser planen, wenn darin eingebaute Sensoren sie frühzeitig über einen sich abzeichnenden Defekt informieren.

    „Es ist eine traurige Tatsache, dass wir heutzutage über viel zu wenig nutzlose Informationen verfügen“, scherzte Oscar Wilde 1894. Er konnte nicht ahnen, welche Flut an Nutzlosem, vor allem aber an Ungenutztem, gut 100 Jahre später dank intelligenter Technik zu sinnvollen Informationen verarbeitet werden würde.

    Quellen
    McKinsey Global Institute; Big Data: The next frontier for innovation, competition, and productivity, Mai 2011. McKinsey Quarterly: Are you ready for the era of big data? Oktober 2011. The Economist; Special Report: Managing Information, Februar 2010.

    Neue und nützlichere Dienstleistungen
    Auf die Bedürfnisse der Nutzer abgestimmt, mit Mehrwert versehen und nachhaltig einsetzbar: Innovative Unternehmen klinken sich in frei zugängliche Datenströme ein und warten mit völlig neuen Angeboten auf.

    Zum Beispiel: Mehr Überblick am Aktienmarkt
    Um schnell einen Eindruck der aktuellen Situation am Aktienmarkt, der Gewichtung der Branchen in einzelnen Sektoren oder von bestimmten Titeln in einer Branche zu gewinnen, ist die visuelle Aufbereitung dieser Informationen nackten Zahlenreihen weit überlegen. Die Möglichkeit, nach Lizenzierung einer erweiterten Version der Applikation die Datenaufbereitung zu personalisieren, macht aus Gelegenheitsbesuchern der Website früher oder später zahlende Kunden.


  • - CollapseBig Data…

    Big Data analysieren

    IBM zeigt mit „Watson“, was mit dem Einsatz von 10 Servern mit 2870 Prozessorkernen, mit Speichertechnik, die kaum das Forschungslabor verlassen hat, und mittels Deep Analysis von Text erreicht werden kann. Da eine dedizierte Rechner- und Speicherhardware zur Analyse von Big Data das IT-Budget sprengen kann, lässt sich die Softwareplattform IBM InfoSphere BigInsights auch in einem Cluster von Standard-PC-Hardware und verteilten Prozessoren betreiben. Dafür wird die auch für Watson verwendete Open-Source-Software Hadoop eingesetzt, mit der ein Grossrechner emuliert werden kann. Für die Sentiment Analysis kommt IBM Cognos Customer Insight zum Einsatz.

    Big Data speichern

    Immer grössere Datenmengen erfordern nicht nur leistungsfähigere Systeme und Investitionen in die Sicherstellung von Datenintegrität und Verfügbarkeit, sondern auch hoch bezahlte Spezialisten, die die komplexen SAN- und NAS-Speicher konfgurieren und bedienen. Die Grid-Speichertechnik der IBM XIV-Hardwareplattform erlaubt Firmen, die mit der Speicherung von Big Data konfrontiert sind, ihre Daten im Vergleich zu herkömmlichen Lösungen mit massiv höherer Leistung mit mindestens identischer Qualität und ohne spezialisiertes Wissen zu speichern.

    Big Data in der Cloud

    Die Cloud-Services „Infrastructure“, „Platform“ und „Software“ sind dazu prädestiniert, Spitzenbedarf bei Volumen und Verarbeitungszeiten abzudecken. Für die Auswertung von Big Data können Cloud-Services von IBM bei Engpässen als „Pay per use“-Service die eigene IT-Infrastruktur ergänzen. Big-Data-Projekte können aber auch vollständig in der Cloud abgewickelt werden: In einem Pilotprojekt im Tessin sammeln in Wäldern ausgebrachte Sensoren Messwerte; wenn spezifische Werte auf einen drohenden Waldbrand hindeuten, alarmiert das System automatisch die Feuerwehr.