Personalisierung bei der Google Suche geringer als gedacht – hauptsächlich regionale Effekte

Die Personalisierung ist deutlich geringer als erwartet, es treten im Wesentlichen regionale Effekte auf. Trotzdem gibt es immer wieder Nutzerinnen und Nutzer, die deutlich andere Suchergebnisse bekommen – die Ursache dafür ist unklar.

Datenspende Bundestagswahl 2017: Erste Analyse, Teil 1

In unserem Datenspende-Projekt gefördert von sechs Landesmedienanstalten haben wir Bürgerinnen und Bürger dazu aufgefordert, uns ihre Suchergebnisse zu 16 Begriffen zu spenden – bestehend aus einer Auswahl von Spitzenpolitikerinnen und Spitzenpolitikern und den Namen der großen Parteien. Betrachtet man die Ähnlichkeit der Suchergebnisse fällt das Ergebnis überraschend aus: die Personalisierung ist deutlich geringer als erwartet, es treten im Wesentlichen regionale Effekte auf. Trotzdem gibt es immer wieder Nutzerinnen und Nutzer, die deutlich andere Suchergebnisse bekommen – die Ursache dafür ist unklar und unsere erste Frage an Google.

Es wird viel spekuliert über den Einfluss, den Suchmaschinen auf die Informationen haben, die wir zur Kenntnis nehmen. Tatsächlich wissen wir sehr wenig darüber, wie sie Informationen gewichten und anzeigen. Aber Suchmaschinen sind so zentral für unser Zusammenleben, dass wir eine Möglichkeit brauchen, sie unabhängig zu überprüfen. Das wollen wir mit einem „Crowdsourcing“-Projekt erreichen, der Datenspende BTW17.

Das Projekt ist eine Kooperation von AlgorithmWatch mit den Landesmedienanstalten Bayern (BLM), Berlin-Brandenburg (mabb), Hessen (LPR Hessen), Rheinland-Pfalz (LMK), Saarland (LMS) und Sachsen (SLM) sowie der TU Kaiserslautern. Medienpartner ist Spiegel Online.

In einer ersten Analyse haben wir uns mit den Daten vom 13.7.2017 (Suche um 18 Uhr) beschäftigt. Unsere Hauptfrage war: Wie sehr unterscheiden sich die Suchergebnisse der Nutzer voneinander? Gibt es klare „Filterblasen“, also Gruppen von Suchergebnissen, die sich stark voneinander unterscheiden?

Dazu haben wir gemessen, wieviele Einträge zwei Personen im Durchschnitt gemeinsam haben, geteilt durch die Gesamtzahl aller Einträge, die mindestens einer von den beiden gesehen hat. D.h., wenn zwei Personen unter den Ergebnissen auf der ersten Seite 7 gleiche Einträge sehen und jeder 10 Einträge sieht, dann sind es insgesamt 13 Einträge, die mindestens einer von beiden sieht. 7 von 13 entspricht dann einem 'Ähnlichkeitskoeffizienten' von 0.54.

[su_note note_color=„#fdf8ad“ text_color=„#6B6947“]Die gesamte Analyse finden Sie hier als pdf-Datei.[/su_note]

Es gibt vier spannende Resultate:

  1. Insgesamt sind sich die Suchergebnislisten im Durchschnitt ziemlich ähnlich. Das ist natürlich eine Sache der Perspektive: wer noch nie von der „Filterblasen-Theorie“ von Eli Pariser gehört hat, der wird erstaunt sein zu hören, dass es Personen gibt, die völlig unterschiedliche Suchergebnislisten sehen. Wer diese Theorie kannte, hätte vielleicht vermutet, in Deutschlands Parteienlandschaft mehrere Bevölkerungsgruppen zu finden, die jeweils sehr unterschiedliche Ergebnislisten bekommen. Das konnten wir aber bis auf einen Fall (siehe Punkt 4) nicht finden. Tabelle 1 zeigt die durchschnittlichen Ähnlichkeitskoeffizienten für alle Politikerinnen und Politiker und Tabelle 2 zeigt die für alle Parteien. Im Durchschnitt heißt dies, dass zwei Nutzer zwischen 7-9 gemeinsame Einträge sehen werden, wenn sie nach einem der genannten Namen suchen und zwischen 6-7, wenn sie nach derselben Partei suchen.
  2. Insbesondere bei den Parteien handelt es sich bei den Ergebnissen, die wenige Leute sehen, in den meisten Fällen um regionale Ergebnisse. Z.B. die Webseite des Grünen-Ortsvereins Köln oder eben die Webseite des Ortsvereins in Berlin Mitte.
  3. Es gibt aber tatsächlich auch Paare von Personen, deren Suchergebnislisten nicht einen einzigen Eintrag gemeinsam hatten - und wir konnten darin kein Muster erkennen, warum das so ist. Weder suchen diese Personen aus dem Ausland, noch sind sie wesentlich öfter eingeloggt oder haben wesentlich öfter die Browsersprache „Englisch“ eingestellt. Die Anzahl der Paare liegt z.B. bei AfD und Angela Merkel jeweils im Promille-Bereich.
  4. Bei der AfD scheint es zwei Cluster an Suchergebnissen zu geben. Tabelle 2 zeigt exemplarisch drei Suchergebnislisten - zwei davon sind stark nachrichtenlastig - sie enthalten 3 Topstories und von den 9 Suchergebnissen sind 6 weitere aktuelle Nachrichten. Dies ist die häufigere Suchergebnislistenart. Insgesamt sind das relativ viele aktuelle Nachrichten für eine Parteiseite, verglichen beispielsweise mit einer Suche nach „Bündnis 90/Die Grünen“.

Insgesamt können wir - mit der bisherigen Nutzergruppe - keine große Personalisierung feststellen, eher eine Regionalisierung z.B. bei Angaben von verschiedenen Ortsvereinen von Parteien oder der Anzeige von Lokalnachrichten. Abzüglich der klaren regionalen Effekte bleiben aber immer noch genügend Suchergebnislisten, die hinreichend verschieden sind und auf eine Art von Personalisierung schließen lassen. Daher stellen wir Google diese Frage:

Erste Frage an Google: Warum gibt es zwei Gruppen für das Keyword „AfD“, die hinreichend unterschiedliche Suchergebnisse sehen, die nicht auf Regionalisierung beruht, aber auch nicht wirklich auf eine Personalisierung hindeutet?

[su_note note_color=„#fdf8ad“ text_color=„#6B6947“]Die gesamte Analyse finden Sie hier als pdf-Datei.[/su_note]

Alexander GaulandAlice WeidelAngela MerkelCem ÖzdemirChristian LindnerDietmar BartschKatrin Göring-EckardtMartin SchulzSahra Wagen-knecht
0.790.690.70.710.630.730.890.680.83

Tabelle  1: Durchschnittliche paarweise Ähnlichkeit aller als deutschsprachig erkannten Suchergebnislisten zu den genannten Politikern. Paarweise wird der Wert wie folgend berechnet: Anzahl gemeinsamer Einträge geteilt durch Anzahl aller Einträge, die mindestens ein Nutzer gesehen hat. Die Berechnung erfolgt auf der Basis der gespeicherten Titel der Seiten, nicht der URLs.

AfDBündnis 90/Die GrünenCDUCSUDie LinkeFDPSPD
0.520.380.460.510.570.570.57

Tabelle  2: Durchschnittliche paarweise Ähnlichkeit der als deutschsprachig erkannten Suchergebnislisten zu den Parteien.

Hash der Suche: fcf8f8ecbedc35fa978e91c087ad9473Hash der Suche: 2f35bffe4ddf63385570617b2b26736aHash der Suche: c54a28d961512d942e93718006ce2839
Alternative für Deutschland: HomeEmpörung über „Scharia-Methoden“ - AfD-Frau will Schießbefehl gegen PlündererEmpörung über „Scharia-Methoden“ - AfD-Frau will Schießbefehl gegen Plünderer
AfD - Home | FacebookHeiko Maas in Dresden: Pegida und AfD planen Protest – Uni verlegt AuftrittHeiko Maas in Dresden: Pegida und AfD planen Protest – Uni verlegt Auftritt
Alternative for Germany - WikipediaGericht gibt AfD Recht - Feldmann muss Facebook-Eintrag löschenGericht gibt AfD Recht - Feldmann muss Facebook-Eintrag löschen
Alternative für Deutschland – WikipediaAlternative für Deutschland: HomeAlternative für Deutschland: Home
#afd hashtag on TwitterAfD - Startseite | FacebookAfD - Startseite | Facebook
AfD Berlin: STARTSEITEAfD-Frau Christel Weißig will Schießbefehl gegen Plünderer - Politik ...AfD-Frau Christel Weißig will Schießbefehl gegen Plünderer - Politik ...
Alternative für Deutschland (AfD): Nachrichten | ZEIT ONLINEAlternative für Deutschland – WikipediaDer Partei fehlen Themen - Panik-Pressekonferenz der AfD - Politik ...
AfD - Alternative für Deutschland - News von DIE WELTNach G-20-Krawallen: AfD-Abgeordnete schlägt vor, Plünderer zu ...Alternative für Deutschland – Wikipedia
Alternative für Deutschland Mecklenburg-Vorpommern | Alternative für ...Heiko Maas in Dresden: Pegida und AfD planen Protest – Uni verlegt ...Nach G-20-Krawallen: AfD-Abgeordnete schlägt vor, Plünderer zu ...
AfD | STERN.deBundestagswahl 2017: Die AfD widerspricht sich so gerne selbst - WELTHeiko Maas in Dresden: Pegida und AfD planen Protest – Uni verlegt ...
Gericht gibt AfD Recht - Feldmann muss Facebook-Eintrag löschen ...Bundestagswahl 2017: Die AfD widerspricht sich so gerne selbst - WELT
Neues Boulevardblatt - Wahlkampfhilfe für die AfD - Medien ...Gericht gibt AfD Recht - Feldmann muss Facebook-Eintrag löschen ...

Tabelle 3: Drei beispielhafte Suchergebnislisten bei der Suche nach „AfD“. Die Liste links enthält keinerlei Top Stories, die anderen beiden jeweils drei. Von den restlichen 9 Suchergebnissen in der Mitte und rechts, sind jeweils weitere 6 Einträge Nachrichtenbeiträge - auf der normalen Google-Suche. Das linke Ergebnis wäre das, was eher dem anderer Parteien entspricht, die rechten Suchergebnislisten sind aber die „typischeren“. Es ist unklar, warum die Suchergebnislisten insgesamt so nachrichtenlastig sind und es zwei verschiedene Sorten von Suchergebnislisten gibt.

[su_note note_color=„#fdf8ad“ text_color=„#6B6947“]Die gesamte Analyse finden Sie hier als pdf-Datei.[/su_note]