Big Data: Die Klassifizierungsmaschine

Sie möchten alles über die Gewohnheiten von Mobiltelefonbenutzern erfahren? Big Data. Sie möchten bestimmte Zielkunden im Internet ansprechen? Big Data. Sie möchten das Geheimnis der erfolgreichsten Serien auf Netflix lüften oder herausfinden, ob in einem Viertel Schlaglöcher repariert werden müssen? Big Data! Mit dem richtigen Algorithmus und der richtigen Menge an Daten – so versprechen Unternehmen im Bereich der Analyse von Megadaten – können sie Antworten auf alle möglichen Fragen finden. Aber wer stellt diese Fragen? Und kann man sich bei der Entscheidungsfindung auf Algorithmen verlassen?

2015 ist das Jahr von Big Data. Das Konzept der Megadaten gibt es seit nunmehr 40 Jahren. Dem Wirtschaftsmagazin Forbes zufolge halten Big Data-Anwendungen jedoch in diesem Jahr Einzug in die Geschäftswelt und Unternehmensführung. Zahlreiche Unternehmen stellen sich auf Big Data ein und passen ihr Geschäftsmodell entsprechend an, um von neuen Chancen zu profitieren: unseren persönlichen Daten.

Mega-Datenverknüpfung

Statistische Analysen hat es immer gegeben. Anhand von Umfragen oder angekreuzten Feldern in einem Erfassungsformular kann mehr oder weniger genau die Wahrscheinlichkeit für die Wahl eines Kandidaten, die Anzahl der Autounfälle in einem Jahr oder die Art von Mensch bestimmt werden, die voraussichtlich einen Kredit zurückzahlt. Dabei können natürlich Fehler auftreten, aber die Zahlen helfen, gewisse Trends zu erkennen. Und anhand dieser Trends erhofft man sich eine Hilfe bei der Entscheidungsfindung.

Heute erzeugen wir diese Daten zu Quintillionen: Daten von Kreditinstitutionen, Cookie-Daten über das Navigationsverhalten von Usern (Episode 2), Informationen von Mobiltelefonen (Episode 04), 50 Millionen Fotos, 40 Millionen Tweets und Milliarden von täglich verschickten Dokumenten – ganz zu schweigen von den Daten, die durch Sportarmbänder, Gadgets und intelligente Geräte jeder Art erzeugt werden. Wie könnte man das anders nennen als Big Data?

Die wahre Revolution von Big Data besteht jedoch nicht so sehr im Umfang, sondern vielmehr in der Art und Weise, wie diese Daten heute miteinander verknüpft werden können. Abgesehen von den Dingen, die sie (oftmals gegen unseren Willen) über uns aussagen, sind es die zahlreichen Korrelationen und Verknüpfungen, die eine Vorhersage der Gewohnheiten und Benutzerverhalten ermöglichen. Sie wollen Ihre Meinung online mitteilen? Eigentlich interessiert das niemanden. . Aber zu wissen, welche Worte Sie mit wem über welches soziale Netzwerk und um welche Uhrzeit austauschen, das ist von Interesse und zahlt sich aus.

Kategorisieren, um die Dinge besser zu lenken

Um in diesem Daten-Dschungel den Durchblick zu behalten wird die Bevölkerung mit Hilfe von Algorithmen kategorisiert. So lässt sich z. B. lediglich anhand einer Postleitzahl das Durchschnittsgehalt eines Verbrauchers vorhersagen. Die Agenturen Esri und Claritas behaupten sogar, allein aus dieser Information das Bildungsniveau, die Lebensweise, Familienzusammensetzung und das Konsumverhalten einer Person ableiten zu können. Und 2012 hat das Unternehmen Target von sich reden gemacht, als es die Schwangerschaft einer Jugendlichen vorhersagte, noch bevor ihre Eltern informiert waren – nur weil sie bestimmte Körperlotionen, Vitamine und Gegenstände in bestimmten Farben gekauft hatte.

Damit die Algorithmen jedoch angemessen funktionieren, sind immer präzisere Kategorien für die Klassifizierung von Individuen erforderlich. Und genau hier lauert die Gefahr der Diskriminierung. Denn so einfach lässt sich der Mensch eben nicht in Schubladen stecken.

Vorhersage und Diskriminierung

Wie Kate Crawford in einem Interview in Episode 05 betont, sind es die Minderheiten und ohnehin schon diskriminierten Bevölkerungsgruppen, die am meisten von Vorhersagefehlern betroffen sind. Je mehr ein Individuum der „Norm“ oder einer vorgegebenen Kategorie entspricht, desto besser können seine Daten ausgewertet werden. Doch was geschieht, wenn man sich am Rande der Gesellschaft bewegt? Was passiert mit denjenigen, die sich nicht gemäß den Vorhersagen von Amazon, Google oder Facebook verhalten?

Erst kürzlich hat Facebook zahlreiche Benutzer verärgert, als schlagartig entschieden wurde, eine der Nutzungsbedingungen des Unternehmens strikt anzuwenden. Besagte Bedingung schreibt vor, dass ein Benutzer seine wahre Identität verwenden muss. Damit verfolge man das Ziel, so das Unternehmen, für eine sicherere Umgebung zu sorgen, in der Hasstiraden eingegrenzt würden. Das erreichte Ziel war jedoch eher die Entfernung der Konten von Transgendern, Dragqueens, Ureinwohnern und Überlebenden von ehelicher Gewalt – unter dem Vorwand, diese Konten zeigten nicht den richtigen Namen. Eine Verletzung sowohl der Grundrechte als auch des Rechts auf Privatsphäre.

Und wie steht es um die Diskriminierungen und Vorurteile, die durch die Algorithmen noch verstärkt werden? Im Jahr 2014 klingelt die Polizei von Chicago bei dem jungen Robert McDaniels. „Wir haben dich im Auge, Bürschchen“, warnen ihn die Polizisten. Ein vom Illinois Institute of Technology entwickelter Algorithmus hatte den 22-Jährigen auf die Liste der 400 potenziell Kriminellen gesetzt – ausgehend von kompilierten Daten über sein Viertel, die Kreuzungen, an denen kurz zuvor Gewalttaten geschehen waren und das Maß, in dem er sich von Verbrechern fernhielt. Fast schon Science-Fiction … Und was, wenn ein Interpretationsfehler vorläge? Wie könnte man das wieder gut machen?

Testen Sie selbst

Ehrlich gesagt: Es ist schwierig, wenn nicht sogar unmöglich, in Erfahrung zu bringen, wie unsere Daten kategorisiert werden – und noch schwieriger, der Kategorisierung zu entkommen. Alles hängt vom Unternehmen, dem verwendeten Algorithmus und den gesuchten Informationen ab. Einige Tools vermitteln jedoch einen kleinen Eindruck von der Art und Weise, wie das Internet uns kategorisiert:

  • Mit der Browser-Erweiterung Floodwatch können wir auf einen Blick alle Werbeanzeigen sehen, die über lange Zeiträume hinweg persönlich auf uns zugeschnitten wurden. Dies ist sehr praktisch zum Zurückverfolgen unseres Navigationsverhaltens und um die Auswirkungen auf unsere Kategorisierung zu erkennen!
  • Noch einfacher: Melden Sie sich bei Ihrem Google-Konto an. à Öffnen Sie die Seite mit den Anzeigeparametern à. Entspricht das Profil Ihrer Person? Entscheiden Sie selbst: Ändern oder korrigieren Sie es – oder nehmen Sie die neue Identität an, um sich besser zu verbergen …

Sandra Rodriguez