Big Data im Verkehr 11. September 2014 von

Im Stau dank Edward Snowden

Unsere Bewegungsdaten aus dem Handy, Sensoren und Messpunkte sind ein Traum für Verkehrsplaner und -unternehmen. Dank Datenauswertung soll es einfacher und schneller von A nach B gehen. Zwar erproben Pilotprojekte das, dennoch werden solche Daten in Deutschland nur punktuell verwendet – auch deshalb, weil es am Vertrauen der Nutzer mangelt.

Standortdaten werden vom allerersten Moment unserer Existenz erfasst, sogar staatlich: Wann und wo wir geboren wurden, steht auf jeder Geburtsurkunde. Es schließt sich ein Dasein an, in dem wir unserer technologisch durchdrungenden Umwelt regelmäßig diese Koordinaten mitteilen, vor allem auf Reisen. Digitale Sensoren stecken inzwischen in jedem Zug, in jedem Bus und in nahezu jeder Hosentasche. Die sich daraus ergebenden Daten sind ein Musterfall von Big Data.

Sie zu nutzen, bietet schlicht gesagt die Chance auf entspannteren und effizienteren Verkehr: Sind alle Verkehrsteilnehmer engmaschig erfasst, lassen sich Transporte planen, Modelle verfeinern, Routen finden, Verkehrsballungen auflösen, umfahren oder gleich ganz vermeiden. Das nützt einerseits Behörden, aber auch der Reiseindustrie, Routenplanern und Logistikern. Wir, die verkehrenden Menschen, profitieren ebenso: Der Verkehr ist flüssiger, Routen akkurater.

IBM mit Musterprogrammen in Dublin, Stockholm und Köln

Teile dieser Versprechen werden bereits eingelöst, zum Beispiel in Dublin. Die irische Stadt began 2010 eine Kooperation mit dem IT-Konzern IBM und dessen „Smarter City“-Programm. Mittels Induktionsschleifen auf den Verkehrswegen und den GPS Daten aus Bussen aggregierte die Stadtverwaltung enorme Datenmengen und analysierte sie mit Hilfe des amerikanischen IT-Riesen. Durch Maßnahmen wie gezielte „grüne Wellen” und eigene Buslinien soll Dublin Reisezeiten um 10 bis 15 Prozent verringert haben. Die Datenbasis wird größer, Wetterstationen, Trams und sogar Stationen des stadtweiten Fahrradverleihs füttern künftig die IBM-Analysewerkzeuge. Ähnliche Projekte gibt es in Stockholm und seit letztem Jahr im vietnamesischen ?à N?ng.

Auch Deutschland versucht sich trotz Sensibilität für Datenschutz an datengestützter Stauvermeidung, ein wenig jedenfalls: Ebenfalls zusammen mit IBM will die Stadt Köln auf der Grundlage existierender Daten den Verkehr besser vorhersagen. Die Daten stammen von gewöhnlichen Verkehrsmessstellen.

Viel feinkörniger arbeitet die Verkehrswacht in Singapur. Dort liefert der Telefonanbieter Starhub aggregierte, anonymisierte Verkehrsdaten seiner Handykunden für ein Gemeinschaftsprojekt mit dem örtlichen Bahnbetreiber und, abermals, IBM. Fällt etwa ein Zug aus, lassen sich für die Pendler auf diese Weise schnell Ersatzlinien einrichten, da praktisch jeder Fahrgast im Blick bleibt. Zusammen mit den Daten des dortigen Bahnbetreibers ergibt sich ein umfassendes Bild über den Stadtverkehr.

Berliner BVG und Bahn nutzen Apps vor allem zur Abrechnung

Solche Daten wären auch in Deutschland theoretisch vorhanden. Inzwischen kann man mit mehreren Handy-Apps ÖPNV-Routen planen und auf der Homepage des Berlin-Brandenburger Verkehrsverbunds auch den Live-Verkehr auf Bus- und Bahnlinien beobachten. Manch ein Symbol bildet keine Messung am konkreten Fahrzeug ab, sondern den Ort, an dem sich das Transportmittel laut Fahrplan befinden sollte. Andere Abbildungen aber basieren tatsächlich auf Echtzeitdaten. Bis Ende des Jahres soll es auch in den U-Bahnen der BVG schnelles Internet geben und damit theoretisch einen Breitbandzugang zu unseren Hosentaschensensoren. Die Tickets kann man in Berlin wie in vielen Städten schon heute auf dem Handy kaufen.

Einen Schritt weiter geht die Anwendung „Touch and Travel“ der Deutschen Bahn, an der auch die BVG als Kooperationspartner beteiligt ist. Passagiere kaufen hier kein Ticket mehr, sondern steigen nach Belieben ein, um und aus; abgerechnet wird danach. „Check-in-/Check-out-System“ nennt sich das. Man startet ein Programm vor Fahrtantritt und meldet sich für die Fahrt an. Dafür scannt man entweder einen Code an der Haltestelle oder erlaubt die Standortbestimmung über GPS.

Doch die anfallenden Daten landen nicht in einer Big-Data-Analyse. „Es werden lediglich persönliche Daten zur Abrechnung erworbener Produkte gespeichert“, beteuert Martell Beck, Bereichsleiter der BVG gegenüber iRights.info. Dabei handelt es sich um Name, Adresse und Zahlungsdaten, die der Kunde hinterlegen muss. „Die Vorteile von ,Touch and Travel’ ergeben sich weniger aus ,Big Data’ als vielmehr aus dem sehr einfachen Zugang, den der Kunde zu einer Fahrkarte bzw. einer Fahrtberechtigung bekommt“, sagt ein Bahnsprecher auf Anfrage.

Die Nutzung der Daten sei stark eingeschränkt, denn das Verkehrsunternehmen erhalte nur „anonymisierte Daten, die belegen, dass eine bestimmte Strecke in einem bestimmten Bereich zurückgelegt worden ist, und für das Unternehmen damit Anspruch auf das entsprechende Entgelt besteht.“ Diese Reisedaten, also Routen- und Preisinformationen, werden eigenen Angaben zufolge nach zwölf Monaten komplett gelöscht, die Standortdaten des Handys für 55 Tage gespeichert; zu Abrechnungszwecken, wie es auch in den AGB von „Touch and Travel“ heißt.

Vertrauensmangel bremst Auswertung

Auch die Telekom zögert noch, obwohl sie auf die Big-Data-Auswertung schielt, darunter etwa auf „die Auswertung von Verkehrsdaten in Echtzeit, um Staus zu verringern“. So lässt sich ihr Datenschutzbeauftragter Claus-Dieter Ulmer im Datenschutzbericht des Unternehmens von 2013 (PDF) zitieren.

Doch sieht Ulmer in den Geheimdienstaffären und dem dadurch erschütterten Vertrauen ein zu großes Hindernis. Die Öffentlichkeit differenziere nicht zwischen der Verarbeitung personenbezogener und anonymisierter Daten. „Unsere Aufgabe als Unternehmen ist es deshalb, das Vertrauen für unsere Sache zu gewinnen.“ Für Big-Data-Auswertungen fehle zudem eine Rechtsgrundlage im Telekommuni­kationsgesetz.

Visualisierung: Carsharing-Fahrten an einem WM-Tag in Berlin

Zumindest der Handel mit Standortdaten ist wohl verboten – so sieht es bislang das Bundeswirtschaftsministerium. Doch das Telekommunikations­gesetz gilt nur begrenzt. So betrifft es nicht solche Daten, die über GPS abgerufen werden, wie der Kieler Datenschutzbeauftragte Thilo Weichert kürzlich im Fachblatt „Straßenverkehrsrecht“ schrieb (PDF). Das könnte ein Grund sein, warum der Navigationsanbieter Tomtom inzwischen Live-Verkehrsdaten im Netz visualisieren kann.

„Smart Steps“ wurde zum Eigentor

Das eigentliche Trauma erreichte deutsche Big-Data-Unternehmungen aber noch vor den Snowden-Enthüllungen, im Jahr 2012: Der spanische Telekommunikationskonzern Telefonica löste mit einer unbedachten Ankündigung einer Big-Data-Anwendung eine Flut der Kritik aus. Anonymisierte Standort- und Bestandsdaten wollte Telefonica an Geschäftskunden und öffentliche Institutionen weitergeben, die diesen eine bessere Grundlage für geschäftliche Entscheidungen liefern sollten. Zum Beispiel: Wo lohnt sich Werbung oder die Eröffnung eines Ladengeschäfts, wo muss eine Ampelschaltung überdacht werden? „Smart Steps“ hieß das Programm. Obwohl das Projekt für Großbritannien angekündigt wurde, war der Aufschrei in Deutschland derart laut, dass Telefonica eine Einführung ausdrücklich ausschließen musste.

Seither erschüttert Edward Snowden mit immer neuen Enthüllungen die Öffentlichkeit. Telekom und Co. müssen sich um ihr Kundenvertrauen bemühen wie um eine antike Porzellansammlung im Erdbebengebiet. Vieles ist schon zerstört, aber gerade die Telefonfirmen haben durchaus noch etwas zu verlieren. Unter den IT- und Telekommunikations­unternehmen vertrauen Nutzern eher noch den ehemaligen Telefonanbietern als den Suchmaschinenbetreibern und sozialen Netzwerken, so eine Studie von Marktforschungs-Verbänden zum Vertrauen in Datenschutz.

Mobilitätsexperten konzentrieren sich auf etwas anderes: Komfort. Wer von Bus auf Bahn, von dort aufs Fahrrad und dann in einen Mietwagen steigen will, soll es künftig einfacher haben. „Anwendungen, die alle verfügbaren Verkehrsmittel vergleichen, sinnvoll kombinieren und so bei der Auswahl der passenden Reisekette helfen, werden eine immer größere Rolle spielen“, so verspricht es ein Sprecher der Deutschen Bahn. Die Big-Data-Analyse massenhafter Standort- und Reisedaten, um etwa bessere Information für Werbekunden, die Verkehrsanalyse und Stauvermeidung zu gewinnen, das lockt die Bahn nach seinen Angaben nicht genug: „Eine Auswertung des Nutzerverhaltens, wie Sie es beschreiben, findet nicht statt und ist auch nicht geplant.“

Forscher: Anonymisierung nur begrenzt möglich

Datenschutzaktivisten wird das wenig beruhigen: Vertrauen kann wachsen, Gesetze lassen sich ändern. Durch eine möglichst frühe Anonymisierung der Bewegungsdaten lässt sich die Gefahr einer Zuordnung verringern. Außerdem ist es weniger wahrscheinlich, dass Hacker an die Klardaten gelangen. Doch eine absolute Sicherheit wird es wohl nicht geben, vermutet Thorsten Holz, Professor für Computersicherheit an der Universität Bochum. „Durch eine geschickte Korrelation mit anderen Daten kann man vermutlich immer Rückschlüsse auf bestimmte Personen erhalten.”

Selbst anonyme Daten können verräterisch sein, sobald nur ein winziger Anteil wieder Einzelpersonen zugeordnet wird. Holz verweist auf eine Studie von Forschern am Massachusetts Institute of Technology und der belgischen Katholischen Universität Löwen. Die Wissenschaftler untersuchten darin einen Datenbestand aus anonymisierten Ortsinformationen von 1,5 Millionen Handynutzern, die über einen Zeitraum von 15 Monaten gesammelt worden waren. Schon vier Zuordnungen genügten demnach, um das Bewegungsprofil von 95 Prozent aller Nutzer wieder sichtbar zu machen.

Das funktioniert, weil unsere Bewegungsmuster einzigartig sind, ähnlich wie ein Fingerabdruck – und in beiden Fällen genügen schon wenige Datenpunkte, um die Identität eindeutig zuordnen zu können. Die Forscher machten zudem eine beunruhigende Entdeckung: Selbst wenn das räumliche und zeitliche Raster der Daten künstlich vergröbert wird, erschwert dies die Identifizierung kaum.

Big-Data-Apologeten werden angesichts solcher Bedenken vielleicht die Augen rollen: Die Deutschen sind noch nicht so weit. Wertfrei lässt sich immerhin zusammenfassen: Ob wir künftig dank Big Data etwas schneller zur Arbeit kommen, hängt auch erheblich davon ab, was Edward Snowden noch veröffentlicht.

Avatar Hendrik Wieduwilt

Hendrik Wieduwilt beschäftigt sich als Jurist, Moderator und Journalist mit Fragen des Internet- und Medienrechts. Seit kurzem arbeitet er für die Berliner Kanzlei Härting Rechtsanwälte.

Zum Thema bei iRights