Schlussbericht: Untersuchung zu Chatbots im Vorfeld der Landtagswahlen 2024

Große Sprachmodelle in Bezug auf Wahlen nach wie vor unzuverlässig

Große Sprachmodelle sind in Bezug auf Wahlen nach wie vor unzuverlässig. Unsere Forschung konnte die Zuverlässigkeit der Schutzmaßnahmen im Microsoft Copilot Chatbot gegen falsche Wahlinformationen in deutscher Sprache erheblich verbessern. Die Barrieren für den Datenzugang schränkten unsere Untersuchungen an anderen Chatbots jedoch stark ein.

Gedruckte Broschüre als Mocjup
Clara Helming
Senior Advocacy & Policy Manager
Oliver Marsh
Head of Tech Research

Dieser Bericht ist der dritte in unserer Reihe über große Sprachmodelle (Large Language Models - LLMs) und Wahlen, nach Berichten im Dezember 2023 und August 2024. Unser Ziel ist es, Chatbot-Antworten umfangreicher und systematischer zu untersuchen als zuvor, um zu prüfen, ob sich Muster für mögliche Risiken für die demokratische Meinungsbildung erkennen lassen.

Wir konnten Microsoft Copilot detaillierter untersuchen als die anderen Modelle. Dies liegt daran, dass wir (i) die Datenerhebung direkt über den Browserzugang zum Chatbot automatisieren konnten und (ii) Microsoft uns einige Daten zum Nutzungsverhalten zur Verfügung gestellt hat. 

Die Untersuchung von Google Gemini sowie GPT-3.5 und 4o von OpenAI war eine größere Herausforderung. Aufgrund technischer Beschränkungen durch die Unternehmen konnten wir die Datenerfassung durch die Chatbots im Browser nicht automatisieren, sondern nur über Schnittstellen (APIs) abrufen. Im Gegensatz zu Chatbots lässt sich der Zugang über die API automatisieren, erfordert aber auch mehr technische Kenntnisse. APIs unterscheiden sich von Chatbots auch durch Funktionen wie Parameter oder Metaprompts, die die Ausgaben beeinflussen können. Daher geben die über die API gesammelten Daten möglicherweise nur einen begrenzten Einblick in die Art und Weise, wie „normale“ Nutzer die Chatbots erleben. Nichtsdestotrotz haben wir auf der Grundlage der API-Daten festgestellt:

Lesen Sie mehr zu unserer Policy & Advocacy Arbeit zu ADM und öffentlicher Meinungsbildung.