Von Big Data, Trump und Bomben: Überraschung – Eure Daten werden genutzt

Für den Psychologen Michal Kosinski steht es fest: Big Data und die geschickte Analyse verfügbarer Daten haben Donald Trump zum US-Präsidenten gemacht - und für den Brexit gesorgt. Wir sind da eher skeptisch!
von Carsten Drees am 6. Dezember 2016

Sonntag platzte ein Bömbchen, zumindest gab es einen Artikel, der am Wochenende im Netz vielfach geteilt wurde – mehr als irgendwas, was ich in den letzten Tagen auf Facebook gesehen habe. Ich habe nur gezeigt, dass es die Bombe gibt, nennt sich der Beitrag, der von der Schweizer Zeitschrift „Das Magazin“ veröffentlicht wurde.

Geteilt wurde er von sehr vielen von mir geschätzten Menschen – der Schlag Mensch, bei dem ich es gewohnt bin, dass er nicht auf irgendwelche Blender-Artikel reinfällt und somit einen echten Mehrwert in meinem News Feed auf Facebook darstellt. Natürlich hab auch ich den Beitrag gelesen und wollte den Link eigentlich auch mit entsprechender Kommentierung teilen. Manchmal halte ich es aber für pfiffiger, einen Moment abzuwarten und eine Story ein wenig sacken zu lassen.

Um es vorwegzunehmen: Ich tue mich im Gegensatz zu vielen anderen schwer mit der Nummer. Nicht, weil ich unterschätze, dass neue Technologien zu einer Gefahr werden können, sondern eher, weil ich den Artikel für wenig ausgewogen halte. Aber vielleicht sollte ich zunächst erklären, worum es in dem Beitrag überhaupt geht:

Michal Kosinski (Quelle: Facebook-Profil)
Michal Kosinski (Quelle: Facebook-Profil)

Big Five

Im Grunde geht es um drei Dinge, besser gesagt um drei Personen: Da ist zunächst mal der bereits erwähnte Psychologe Michal Kosinski, den ich euch vorstellen möchte: Er ist Experte für Psychometrie und Verfechter der Ocean-Methode bzw.des Fünf-Faktoren-Modells aka Big Five. Es geht dabei um fünf Merkmale einer Persönlichkeit, nach denen sich eine Person denkbar genau einordnen lässt. Je nachdem, wie stark ausgeprägt einer dieser Faktoren ist, wird eine Person dementsprechend unterschiedlich eingeschätzt. Ist beispielsweise der Faktor „Gewissenhaftigkeit“ besonders ausgeprägt, haben wir es aller Wahrscheinlichkeit mit einem sehr effektiven und organisierten Menschen zu tun. Ist der Faktor eher schwach ausgeprägt, erhält die bewertete Person die Attribute „unbekümmert“ und „nachlässig“. Die fünf Faktoren im Überblick:

Faktorschwach ausgeprägtstark ausgeprägt
Offenheit für Erfahrungenkonservativ, vorsichtigerfinderisch, neugierig
Gewissenhaftigkeitunbekümmert, nachlässigeffektiv, organisiert
Extraversionzurückhaltend, reserviertgesellig
Verträglichkeitwettbewerbsorientiert, antagonistischkooperativ, freundlich, mitfühlend
Neurotizismusselbstsicher, ruhigemotional, verletzlich

Auf Basis dieser Methode hat Kosinski eine Facebook-App entwickelt, die Persönlichkeitsprofile entwirft und diese Technik über die letzten Jahre stets weiter verbessert. Im Magazin wird die Vorgehensweise so beschrieben:

Zuerst legt man Testpersonen einen Fragebogen vor. Das ist das Onlinequiz. Aus ihren Antworten kalkulieren die Psychologen die persönlichen Ocean-Werte der Befragten. Damit gleicht Kosinskis Team dann alle möglichen anderen Onlinedaten der Testpersonen ab: was sie auf Facebook gelikt, geshared oder gepostet haben, welches Geschlecht, Alter, welchen Wohnort sie angegeben haben. So bekommen die Forscher Zusammenhänge. Aus einfachen Onlineaktionen lassen sich verblüffend zuverlässige Schlüsse ziehen.

Es werden auch Beispiele genannt für diese Schlüsse: Hört ihr Wu-Tang Clan, seid ihr vermutlich heterosexuell, gefällt euch hingegen die Kosmetik-Marke MAC, deutet das bei Männern auf Homosexualität hin. Lady Gaga-Anhänger werden als extrovertiert eingeordnet.

Kosinski kommt 2012 an den Punkt, an dem er mit seiner Methode mithilfe von 68 Likes eines Users mit 95-prozentiger Treffsicherheit seine Hautfarbe voraussehen kann, Homosexualität mit 88-prozentiger Genauigkeit und auch politische Ausrichtung, Intelligenz, Drogen- und Alkoholkonsum und Religion können so bestimmt werden. Laut Kosinski reichen ihm schon 10 Likes einer Person, damit er sie besser einschätzen kann, als es ein Arbeitskollege dieser Person könnte. Je mehr Likes, desto genauer die charakterliche Einordnung des Facebook-Nutzers – mehr als 300 Likes sollen demnach genügen, damit ihr besser eingeschätzt werdet als es euer eigener Partner könnte.

Irgendwann wurde Kosinski sich dessen bewusst, was eine Technik anrichten kann: Es können nicht nur ziemlich genau zutreffende psychologische Profile erstellt werden, man kann auch umgekehrt nach bestimmten Typen suchen lassen – Kosinski hat eine Menschen-Suchmaschine entworfen.

Die ganze Story liest sich durchaus spannend und ihr solltet sie durchaus gelesen haben, um euch eure eigene Meinung zu bilden. Für uns ist jetzt an dieser Stelle lediglich wichtig, dass er seiner Idee beraubt wurde und das von ihm entworfene Modell jetzt vom Big-Data-Unternehmen Cambridge Analytica (CA) kommerziell ausgeschlachtet wird. Damit kommen wir zu den Personen Zwei und Drei, die hier eine Rolle spielen: Cambridge Analytica-CEO Alexander James Ashburner Nix und schließlich President-Elect Donald Trump.

donald-trump-1547274_1920

Hat Cambridge Analytica Trump zum Präsidenten gekrönt?

Ich hab die Vorgeschichte bewusst ausführlicher behandelt, damit ihr im Bilde seid, wie viel mit Big Data bzw. dem richtigen Deuten von Daten möglich ist – und was eben nicht. Das spielt insofern eine Rolle, als der Psychologe Kosinski uns klar machen will, dass es seine Technik ist, die Trump zum Präsidenten gemacht hat. Alexander Nix und Cambridge Analytica sind demnach die Profiteure, weil sie das Modell erfolgreich Politikern anbieten – und unterm Strich dann auch Donald Trump, denn er hat insgesamt 15 Millionen ins Unternehmen gesteckt, damit Cambridge Analytica zum Wahlerfolg beiträgt. Apropos Alexander Nix – hier spricht er über die Möglichkeiten des Modells:

Die Wahlhelfer von Trump sollen sogar eine App genutzt haben, die ihnen konkret vor dem Besuch eines potenziellen Wählers offenbart hat, wie die Person tickt und mit welchen Argumenten man ihn dazu bewegen kann. sein Kreuzchen bei Trump und nicht bei Hilton zu machen.

Damit ist die Geschichte des Schweizer Magazins im Grunde zu Ende erzählt: Wissenschaftler entwickelt revolutionäres Modell, Modell wird geklaut, verschachert und jetzt missbraucht, um politische Entscheidungen der Wähler zu lenken. Ganz ehrlich: Das ist ein super Plot, klingt ein bisschen nach Science Fiction und ein bisschen nach der Serie Black Mirror – und ja: Ich würde mir den Film dazu gerne anschauen.

Das ist es dann aber auch, Leute! Kein Analyst spielt hier den Königs- bzw. Präsidentenmacher. Die Geschichte klingt wie gesagt spannend, aber es bleibt eben eine Geschichte. Was mich gestört hat beim Lesen und in der Folge: Mir fehlt da irgendwie ein Link! Ich kann nachvollziehen, dass die geschickte Verknüpfung von Daten sehr viele Rückschlüsse zulässt. Ich begreife aber nicht, wie man so geschicktes Targeting nutzt, um Gehirnwäsche zu betreiben.

Im Artikel heißt es, dass CA durch die Kenntnisse, die man im Vorfeld sammelt, bestimmten Personen genau die passenden Phrasen, Zitate und Ideen Trumps präsentieren kann, die sie darin bestärken, Trump zu wählen. Oder andersrum: Man kann Clinton-Anhängern gezielt Nachrichten zukommen lassen, welche bewirken sollen, dass sie der Wahlurne fernbleiben. Konkretes Beispiel: Den Bürgern mit haitianischen Wurzeln in Miami erzählt man, wie kolossal die Clinton-Stiftung nach dem schweren Erdbeben in Haiti versagt habe.

Big Data ist kein Teufelswerk

Nicht erst, seit „Big Data“ es vor Jahren zum Buzzwort gebracht hat, diskutieren wir darüber, welche Auswirkungen das Sammeln von Daten haben kann, welche Spuren wir im Netz hinterlassen etc. Das ist aber kein Voodoo, bei dem es eines rätselhaften Algorithmus bedarf, der von einem shiny new Unternehmen für jede Menge Geld angeboten wird.

Targeting ist ein alter Hut – ihr selbst könnt auf Facebook dank Social Graph Leute finden, die Band A hören, Partei B wählen, oder in Ort C wohnen. Natürlich werden alle gesammelten Daten genutzt, um euch Werbung unterzujubeln, die möglichst auf euch passen soll – dass das im Einzelfall nicht immer so richtig funktioniert, seht ihr ja vermutlich selbst. Wichtiger aber noch: Data Broker betreiben schon seit vielen Jahren das Geschäft mit unseren Daten. Werft mal einen Blick auf diesen Beitrag aus dem Jahre 2014 und schaut euch an, welche Datensätze da den Besitzer wechseln. Der Artikel über Data Mining im Time Magazine stammt sogar schon aus dem Jahre 2011 und erklärt ebenfalls, welche Datenmassen von uns allen im Umlauf sind.

Bin ich ein Menschenfreund unabhängig von Hautfarben, Herkunft und Religionen, dann mache ich mein Kreuz sicher nicht bei Trump – egal, was mir das Targeting auch für Nachrichten unterjubelt.

Der Punkt dabei: Ja, man kann sehr viel Erkenntnisse aus diesen Daten ziehen und bis zu einem gewissen Grad können wir dadurch auch ganz sicher manipuliert werden. Sehe ich drei mal eine großartige Nerd-Shirt-Werbung, dann kaufe ich das Shirt irgendwann. Aber hey: Wenn die Werbung mir ein BVB-Trikot vorschlägt, weil ein pfiffiger Datensammler erkennt, dass ich in Dortmund wohne, dann schlage ich auch beim zehnten Mal nicht zu.

So dürfte sich das auch bei den Wahlen verhalten: Wenn ich mir eine Meinung bilde und zu dieser Meinung gehört, dass keine Muslime ins Land kommen sollen, Mexikaner auch lieber zuhause bleiben sollen und „grab them by the pussy“ gesellschaftlich zum guten Ton gehört, dann kaufe ich das Produkt Trump. Denke ich aber wirtschaftlich als auch in jeder anderen Hinsicht global, bin ich ein Menschenfreund unabhängig von Hautfarben, Herkunft und Religionen, dann mache ich mein Kreuz sicher nicht bei Trump – egal, was mir das Targeting auch für Nachrichten unterjubelt.

Das sind die beiden Punkte, auf die ich hinaus möchte:

  1. Big Data ist ein Thema, welches wir unbedingt auf dem Schirm haben müssen – aber kein Neues.
  2. Eine Meinung kann durch passende Nachrichten bestärkt werden – aber nicht entgegen den eigenen Vorstellungen ins Gegenteil verkehrt werden.

Eine Bitte

Abschließend möchte ich euch euch darum bitten, die gleichen Maßstäbe an euch selbst anzulegen, die ihr auch sonst als richtig erachtet. Fake-News waren in den letzten Wochen ein riesiges Thema, auch bei uns auf dem Blog:

Lesenswert: Sorry, Herr Zuckerberg, aber wir glauben Dir kein Wort mehr

Wir sind alle clever genug zu erkennen, dass wir uns alle in Filterblasen befinden. Dort finden wir nicht nur Freunde, die unserer Meinung sind, sondern lesen auch vor allem Berichte, die unsere Meinung festigen. Wenn wir sehen, dass die AfD einen Artikel teilt, indem die Unwahrheit geschrieben wird, erkennen wir das alle und weisen entsprechend drauf hin – mehr oder weniger empört.

Wir können nicht gleichzeitig alle von Fake News schwafeln und dann solche Texte massenhaft teilen, nur weil uns die Geschichte ins Weltbild passt. Christian Alt

Aber Leute, wir dürfen dabei nicht die Begabung verlieren, auch die Beiträge so objektiv zu lesen, die besser zu unserer Gesinnung, Meinung und Philosophie passen! In diesem Fall sind wir alle immer noch ratlos, wieso der Abklatsch einer Stutenkerl-Version eines Politikers ins mächtigste politische Amt der Welt gewählt werden konnte. Und zack – kommt der passende Artikel mit der Lösung um die Ecke! Big Data isses – endlich wissen wir, wie das passieren konnte. Cambridge Analytica hat das Wahlvieh vor sich her getrieben und dazu gebracht, das Kreuz an einer bestimmten Stelle zu machen. Sorry, Freunde – so einfach ist es eben nun mal nicht. Ich muss zugeben, dass es mich ziemlich verunsichert hat, dass so viele Leute in meiner „Bubble“ einen Artikel teilen, dem ich nach gründlichen Lesen so gar nicht beipflichten wollte. Leute, die nachweislich intelligent sind, aber hier für mein Empfinden dem Autor dennoch auf den Leim gegangen sind. Ich möchte Jens Scholz zitieren, der einen bärenstarken Beitrag zum Thema  geschrieben hat:

Wie kommen Menschen immer wieder auf die irgendwie religiös mathematikhörige Idee, dass man menschliches Verhalten derart leicht kategorisieren, vorhersagen und dann sogar steuern könnte? Selbst auf dem Finanzmarkt, der viel mathematischer und in weniger Dimensionen funktioniert hat man bewiesen, dass eine egal mit wie vielen Daten unterfütterte Vorhersage kein bisschen genauer ist, als eine Vorhersage, die auf reinen Zufallszahlen basiert. Man braucht ein magisches Weltbild, um an eine Formel zu glauben, die mathematisch das Wort errechnet, das man einem Menschen sagen muss, damit er plötzlich und willenlos seine Meinung ändert. Jens Scholz

Ihr seid noch nicht überzeugt?

Ich merk schon, ihr seid immer noch skeptisch, weil das Szenario in all seiner Dramatik so überzeugend und schlüssig wirkt. Vermutlich bekomme ich das hier auch nicht komplett entzaubert, aber ein paar Anmerkungen möchte ich doch noch loswerden, die ihr euch durch den Kopf gehen lassen solltet:

1. Kosinskis Methode und die von Cambridge Analytica liefern unterschiedliche Ergebnisse

Wie Wired berichtet hat, hat sich ein Bloomberg-Reporter bereits im letzten Jahr ein Profil bei Cambridge Analytica anlegen lassen und die Ergebnisse des Unternehmens mit den Ergebnissen verglichen, die Kosinskis Team herausgearbeitet hat – und sie weichen deutlich voneinander ab. Wie präzise kann also eine Vorhersage sein, wenn die Ergebnisse schon bei sehr ähnlichen Ansätzen so unterschiedlich ausfallen?

2. Probiert Apply Magic Sauce aus

Wer mag (und bereit ist, seine Daten zu opfern), kann auf Appy Magic Sauce die Kosinski-Methode anhand des eigenen Facebook-Profils ausprobieren. Ich hab mich natürlich mit meinen Daten für euch reingeworfen und bekomme unter anderem Folgendes präsentiert:

apply-magic-sauce

Meine Affinität zu Depeche Mode soll also aussagen, dass ich einen „organisierten und hart arbeitenden Eindruck“ mache, während meine Leidenschaft für die Serie „Supernatural“ aus mir einen impulsiven und spontanen Menschen macht, Das Schauen der Simpsons hingegen sorgt dafür, dass ich eher als traditionell und konservativ einsortiert werde. Leitet daraus vielleicht einfach selbst ab, wie präzise Vorhersagen auf Basis von Facebook-Likes sind.

Der Test ermittelt übrigens auch, dass ich intelligenter bin als 98 Prozent der Bevölkerung – vielleicht mein stärkstes Indiz dafür, dass die Methode nicht wirklich zuverlässig ist ;)

apply-magic-sauce-2

Dass ich „The Who“ irgendwann gelikt habe, erhöht übrigens die Wahrscheinlichkeit, dass ich Single bin, mein Like für „The Beatles“ hingegen mindert diese Wahrscheinlichkeit. Wie kann ein Algorithmus so etwas ableiten aus Likes, die ich vor 6 oder 7 Jahren vergeben habe? Damals war ich übrigens noch nicht Single – nimm das, Algorithmus! Übrigens hat das Toole mit einer Wahrscheinlichkeit von 61 Prozent errechnet, dass ich Single bin. Bedeutet, dass es also eine knapp 40 Prozent große Wahrscheinlichkeit gibt, dass ich es nicht bin – ein beliebiger Blick auf meine Postings an einem beliebigen Tag dürfte da mehr Gewissheit bringen als dieser wertvolle Algorithmus. Immerhin aber erkennt er mit sehr hoher Wahrscheinlichkeit, dass ich männlich, hetero und nicht religiös bin.

3. Cambridge Analytica ist nachweislich kein Erfolgsgarant

Nachdem wir den Artikel gelesen haben und wissen, dass Trump durch Cambridge Analytica unterstützt wurde: Können wir daraus schon ableiten, dass das System tatsächlich funktioniert? Nein, natürlich nicht! Im Zusammenhang mit besagtem Artikel wird auch immer der Brexit erwähnt, weil CA dort involviert gewesen wäre im Rahmen der „Leave“-Kampagne. Außerdem brüstet sich das Unternehmen damit, dass durch ihre Mithilfe auch Ted Cruz vom unbeliebten Politiker zu einer ernstzunehmenden Trump-Konkurrenz gewachsen ist in den Vorwahlen.

Fakt ist aber, dass Wired bereits im Sommer darüber berichtet hat, dass die Zusammenarbeit anlässlich der Leave-Kampagne aus finanziellen Gründen nicht zustande kam. Und was Cruz angeht, hat der hochgeschätzte Kollege Dennis Horn auf dem WDR-Blog Digitalistan die richtigen Worte gefunden:

Wenn die Dienstleistung von Cambridge Analytica aber so gut ist, wie das Unternehmen behauptet – warum ist Ted Cruz dann nicht der neue Präsident? Schließlich konnte er zu einer Zeit auf die Analyseergebnisse zurückgreifen, zu der Donald Trump es noch nicht tat. Vielleicht liegt es auch daran, dass Cambridge Analytica seine Versprechen nicht erfüllen konnte – und deshalb von Ted Cruz‘ Wahlkampfteam mitten in der Kampagne fallengelassen wurde? Dennis Horn, Digitalistan

Schließlich kommt der Artikel „Ich habe nur gezeigt, dass es die Bombe gibt“ selbst zu dem Schluss, dass ein wirklicher Zusammenhang nicht wirklich belegt werden kann.

Aber wie gross war der Einfluss der psychometrischen Methoden auf den Ausgang der Wahl? Cambridge Analytica will auf Anfrage keine Belege für die Wirksamkeit der Kampagne liefern. Und es ist gut möglich, dass die Frage nicht zu beantworten ist.

4. Wer kommt im „Bomben“-Artikel zu Wort?

Zu guter letzt: Wer erzählt uns denn da eigentlich die Story im besagten „Bomben“-Beitrag? Ich erwähnte es weiter oben schon, dass wir uns vielleicht ein bisschen zu arrogant als total medienkompetent einordnen, wohingegen wir bei Anhängern der Rechtspopulisten immer genau diese Kompetenz einfordern. Nicht jeder Leser muss einen solchen Beitrag säuberlich nach journalistischen Maßstäben sezieren, das ist klar. Aber man sollte beim Lesen feststellen, dass sich die ganze Nummer allein auf die Aussagen von zwei Menschen stützt: Dem Typen, der sich die Technik ausgedacht hat – und der Typ, der da gerade Asche mit verdient.

Jetzt lasst uns mal kurz überlegen, wie objektiv die das Ganze bewerten. Ist doch klar, dass die Geschichte von den beiden so ausgelegt wird, als könnte man künftig nur noch Wahlen gewinnen, wenn man einen der beiden mit im Boot hat. Bei allem angebrachten Respekt vor dem, was Big Data mit uns und der Welt anstellt: So ist es nun mal nicht. Als Rauswerfer gebe ich euch noch das Statement von Christian Alt an die Hand und bin gespannt, welche Meinung zum Thema ihr in den Kommentaren vertretet.

 

Danke an Caschy, der die Cambridge Analytica-Geschichte ebenfalls skeptisch sieht und durch den ich auf den Beitrag von Christian Alt aufmerksam wurde und vor allem danke an Dennis und Jens, die mit ihren gelungenen Artikeln zum Thema auch die Stoßrichtung meines Beitrages vorgegeben haben. Ich hab mich da einfach mit dran gehängt im Glauben, dass sich ruhig noch mehrere Stimmen dazu äußern sollten.