Machine Learning
Facebook weiß, dass Du rauchst, säufst, kiffst und kokst

Facebook und andere Plattformen sind offenbar in der Lage, einen möglichen Tabak-, Alkohol- oder Drogenmissbrauch ihrer Nutzer mit einer hohen Genauigkeit vorherzusagen. Eine Studie mit 11 Millionen Nutzern kommt auf Trefferquoten von über 80 Prozent. Die Erkenntnisse könnten von Werbetreibenden ausgenutzt werden.

Soziale Netzwerke wie Facebook können mit Machine Learning vorhersagen, ob ein bestimmter Nutzer zum Drogen-, Tabak- oder Alkoholmissbrauch neigt. In einer Untersuchung von insgesamt elf Millionen Facebook-Accounts ließen sich mehr oder weniger eindeutige Verhaltensmuster erkennen, mit denen eine entsprechende Einordnung getroffen werden konnte. Die Erkenntnisse lassen sich mit hoher Genauigkeit auf andere Nutzer übertragen.

Interessant (und für den ein oder anderen vermutlich erschreckend) ist, dass die Forscher des Addiction Recovery Research Centers in Roanoke (Virginia) dazu nicht auf zwingend eindeutige Hinweise angewiesen waren. Sie mussten sich z.B. nicht auf Beiträge verlassen, in denen der jeweilige Nutzer öffentlich seinen Kumpels zuprostet.

Vielmehr legten sie für ihre Studien bestimmte Schlüsselwörter fest, die aus vorherigen Untersuchungen von Menschen mit Verhaltensstörungen stammen, die man wiederum mit Drogen-, Tabak- oder Alkoholmissbrauch in Verbindung bringt. Zu diesen Schlüsselbegriffen gehören Schimpfwörter wie „fuck“ und „shit“, aber auch der ansonsten vergleichsweise seltene Gebrauch von Wörtern wie „hate“, „kill“, „blood“ oder „pain“.

Zugleich gibt es wohl eine wissenschaftliche Grundlage für die Zuordnung bestimmter Interessen: Wer beispielsweise den Film „V for Vendetta“ mag, soll dem Alkohol zugeneigt sein, während Liebhaber von Zeichentrickfilmen eher nicht zur potentiell gefährdeten Gruppe gehören.

„fuck“, „shit“, „hate“, „kill“, „blood“ oder „pain“

Erklärtes Ziel der Studie war, dass man mit maschinellen Lernmethoden Menschen mit einer beginnenden oder bereits ausgeprägten SUD (substance use disorder, psychische Auffälligkeit oder Verhaltensstörung bei Drogennutzung) identifizieren wollte. Dieses Ziel haben die Forscher offenbar erreicht: die Tabaknutzung konnte mit einer Trefferquote von 86%, der übermäßige Alkoholkonsum mit einer Trefferquote von 81% und ein Drogenmissbrauch mit einer Genauigkeit von 84% vorhergesagt werden.

Insgesamt soll der wissenschaftliche Ansatz über Algorithmen und Machine Learning alle heutzutage gängigen Methoden zur Suchterkennung übertreffen. Hinzu kommt, dass die zugrundeliegende Datenbasis von 11 Millionen Nutzern vergleichbare Studien in den Schatten stellt.

Während man den Suchtforschern noch mehr oder weniger altruistische Motive unterstellen darf, beleuchtet die Studie natürlich auch das (Missbrauchs-)Potential von Facebook in diesem Bereich. Im schlimmsten Fall denkbar wäre, dass die werbefinanzierte Plattform ganz gezielt Werbeanzeigen für alkoholische Getränke an Nutzer ausspielt, die von den Algorithmen als “beste” Zielgruppe identifiziert wurden. Theoretisch möglich wäre zumindest, dass man über die eindeutige Zuordnung bestimmter Werbeanzeigen hinaus die unverfänglicheren Möglichkeiten nutzt und z.B. Partys bewirbt. Zugleich gibt es selbstverständlich Szenarien, in denen Ermittlungsbehörden, Krankenkassen, Versicherungen oder Arbeitgeber auf solche Erhebungsmethoden und die daraus resultierenden Erkenntnisse zurückgreifen könnten.

Erst kürzlich hatte ein internes Strategiepapier von Facebook offenbart, dass man sich der Möglichkeiten durchaus bewusst ist und u.U. irgendwann in Erwägung ziehen könnte, solche Informationen zu nutzen. Ein einer australischen Zeitung zugespieltes Dokument hatte gezeigt, dass emotional belastete Teenager über ihre Likes und Beiträge recht zuverlässig identifiziert werden können. Facebook hatte darauf hingewiesen, dass man lediglich für den internen Gebrauch und einen ausgewählten Werbetreibenden “skizzieren” wollte, wie sich Menschen bei Facebook “ausdrücken”.

Quelle: arxiv.org via winfuture.de