Big Data - offene Datensätze der Stadt New York

Wir haben uns gefragt: An welchem praktischen Beispiel können wir den Nutzen, die Verarbeitung und Erfassung von Big Data am Besten erklären?

Sicher bieten Facebook, IBM und Google vielfach zitierte und beleuchtete Use Cases. Allerdings haben wir uns für einen anderen Global Player entschieden, der unserer Meinung nach ein noch plastischeres Beispiel abgibt, da es mehr das "echte Leben" repräsentiert als das reine Online-Business:

Die Stadt New York

Was Big Data für Ihr Unternehmen bedeuten kann, wird sich vermutlich erst in den kommenden Monaten und Jahren zeigen. Wir denken aber, das Beispiel der Stadt New York eröffnet einige Blickrichtungen darauf wie:

  • Erkenntnisse aus Big Data gezogen und genutzt werden können
  • wertschöpfende Produkte aus Big Data entstehen
  • welchen Sinn das freigeben von Datensätzen machen kann.

New York City gibt Daten-Sammlungen aus Behörden und sog. städtische Einrichtungen schon seit einigen Jahren frei. Im März 2012 hat Bürgermeister Bloomberg die Gesetz-Einführung Nummer 29-A abgesegnet, die zunächst bis 2018 die Sammlung von städtischen Daten standardisiert und den weiteren Umgang mit ihnen im Rahmen des US-weiten Data.Gov Programms regelt, das zukünftig eine weltweite Plattform für offene Daten aller Art darstellt. Ziel dieser Initiative ist es, die Arbeit von Regierungen aller Arten und Größen transparenter zu machen, Bürgerbeteiligung zu fördern und Entwicklern Rohdaten zu liefern, auf deren Basis neue Anwendungen und Erkenntnisse entstehen.

Was kann daraus entstehen?

Das Ganze klingt bis hierher sehr abstrakt. Daher nennen wir Ihnen vorweg einige Beispiele, die aus den freigegebenen Daten im Rahmen des Programmierwettbewerbs "BIG APPS" entstanden sind, in dem Entwickler verschiedenste Datensätze kombiniert und zu echten Endnutzeranwendungen mit öffentlichem Nutzen verarbeitet haben:

  • Embark NYC http://2011.nycbigapps.com/submissions/5738-embark-nyc Sind Sie schon einmal mit der New Yorker U-Bahn unterwegs gewesen? Nicht nur Touristen sind damit hin und wieder überfordert. Embark NYC nutzt die aktuellen Daten der Subway um Verspätungen als Benachrichtungen zu versenden, weist anhand von konfigurierbaren Routen auch ohne Funksignal den Weg durch U-Bahn-Stationen und den Fahrplan. Innerhalb kürzester Zeit nutzten über 100.000 New Yorker bereits die App.
  • Clean Streets of New York http://2011.nycbigapps.com/submissions/5886-the-clean-streets-of-new-york - Diese App soll v.a. die umweltbewussten Bürger ansprechen. Sie greift die Geo-Position des Nutzers ab und zeigt alle im Umkreis befindlichen Grünflächen, öffentlichen Gärten und Parks an. Um diese Grünflächen sauber zu halten, bietet die App gleichzeitig die Option, Recycling-Sammelstellen sowie die Einsatzpläne der Müllabfuhr anzuzeigen.
  • My NYC Running Tracks http://2011.nycbigapps.com/submissions/5871-my-nyc-running-tracks Eine App für sportliche Bewohner der Metropole: Nutzer können besonders geeignete Laufstrecken in ihrer Nachbarschaft anlegen
  • Sage: Pre-K and Elementary Schools Search http://2011.nycbigapps.com/submissions/5837-sage-pre-k-and-elementary-schools-search - Die Wahl der richtigen Schule ist eine lebensprägende Entscheidung. Neben Hörensagen und Empfehlungen möchten wir uns natürlich auch auf Daten und Fakten stützen. http://nysage.com/ bietet neben einer Kartendarstellung der Schulen um den Standort des Nutzers eine Auswertung der durchschnittlichen Abschlüsse und Notenverläufe.
  • NYV Smoke Out http://2011.nycbigapps.com/submissions/5587-nycsmokeout - New York ist eine Nichtraucherstadt mit zahlreichen Rauchverbotszonen. Eine Missachtung kann bis zu 50$ Strafe kosten. Die Geo-Daten dieser Zonen werden in der App auf einer Karte dargestellt und zeigen dem Nutzer, in welchen Gegenden der blaue Dunst teuer werden kann.

Was ist dazu nötig?

Zunächst braucht man natürlich die Roh-Daten. Die liefern - wie bereits gesagt - die städtischen Einrichtungen New Yorks (wie z.B. das Amt für Verbraucherschutz) mit über 850 Datentabellen. Doch lässt sich nun sinnvoll auf diese Daten zugreifen? Sie müssen sinnvoll beschrieben, kombiniert und visualisiert werden, um Zusammenhänge zu entdecken, die sich zur Weiterverwendung nutzen lassen. Hier kommt der Gewinner des Big Apps Wettbewerb 2012 ins Spiel:

NYC Facets, die ein Online-Tool entwickelt haben, mit denen sich die unterschiedlichen Datenmengen auch durch Laien als Diagramme anzeigen, filtern und in Beziehung setzen lassen. So bekommen unübersichtliche Tabellen zunächst einmal einen Sinn und können mit Meta-Daten beschrieben, oder durch APIs mit internen Unternehmensdaten in Zusammenhang gebracht werden.

Beispielsweise enthält das OpenDataSet Listen sämtlicher Elektro-Läden http://nyc.pediacities.com/facets/index.php/Electronic_store_competitors_%28r9jk-nd53%29#tab=Columns und Straßencafés mit Größe der Grundfläche http://nyc.pediacities.com/facets/index.php/Map_View_%28b8ak-guj9%29. In Kombination mit den Verkaufsdaten von Eigentumswohnungen und Wohnhäusern in der entsprechenden Gegend (http://nyc.pediacities.com/facets/index.php/DOF_Summary_of_Neighborhood_Sales_for_Manhattan_for_Class_1-_2-_and_3-Family_homes_-_2009_%285yay-3jd5%29) kann ein Unternehmen Bewertungen von Standorten durchführen und bsw. Entscheidungen für Neueröffnungen oder das Dienstleistungsangebot treffen.

Welches Potenzial steckt für Unternehmen nun also in diesen Daten?

Das Beispiel von New York City zeigt, welch spannenden Lösungen durch die reine Freigabe von Big Data entstehen können, an die vorher niemand auch nur im Entferntesten gedacht hat. Ein großer Teil der entstandenen Apps hat zunächst einmal eher sozialen Nutzen. Doch es ist bereits erkennbar, welch ungeheure Eigendynamik sich entwickelt, wenn offene Daten aus unterschiedlichsten Quellen zur kombinierten Nutzung frei gegeben werden, aus der neue, wertschöpfende Produkte und individuelle Lösungen entstehen.

Für Unternehmen kann eine Nutzung und Beteiligung an vergleichbaren Programmen bedeuten:

  • bessere Entscheidungen auf erweiterten Erkenntnissen zu treffen
  • neue Märkte erkennen
  • innovative Produkte entwickeln
  • Services verbessern
  • Zielgruppen anhand von erkanntem Nutzerverhalten schärfen

Werden nun öffentliche nutzbare Daten mit internen Firmendaten kombiniert, entstehen ganz neue Erkenntnisse und Entscheidungsgrundlagen für neue Geschäftsfelder oder Kundengruppen.

Gehen wir dann noch einen Schritt weiter und denken darüber nach, dass Unternehmen eigene Datensätze veröffentlichen (natürlich anonymisiert und unbedenklich für den Wettbewerb), ergibt sich ein noch größeres Potenzial, von dem wir heute nur vermuten können, welche Informationsschätze im Verborgenen schlummern.