Korrelation, Kausalität, Proxy-Variablen?

Das Themenfeld automatisierter Entscheidungssysteme ist weitreichend und komplex. Technische Konzepte sind für Nutzer*innen und Betroffene oft schwer zu verstehen, was solche Systeme noch obskurer macht, als sie eh schon sind. Mit unseren Erklärvideos bieten wir einen leichten Einstieg in wichtige Grundlagen. Wir hoffen, so ein wenig Licht in die "Black Box" der Algorithmen zu werfen und über die begleitenden Risiken aufzuklären.

Proxy-Variablen

Proxy Variablen sind Stellvertreter, die oft in Software-Anwendungen vorkommen. Obwohl bestimmte Merkmale, wie z.B. die Herkunft von Bewerber·innen, von einem System ignoriert werden sollen, können diese mithilfe von Proxy-Variablen dennoch bestimmt werden. Dies kann z.B. in Software, die zur automatisierten Bewertung von Bewerbungen eingesetzt werden, zu Diskriminierung führen.

Korrelation & Kausalität

Korrelation ≠ Kausalität. Korrelationen, also Zusammenhänge von Ereignissen oder Phänomenen, begegnen uns täglich. Zum Beispiel steigt im Sommer sowohl der Konsum von Eis, als auch die Anzahl Toter durch Ertrinken. Daraus lässt sich jedoch nicht unbedingt schließen, dass die Ursache (Kausalität) für die Ertrunkenen der steigende Eiskonsum ist. Wenn bei der Interpretation von Daten Korrelation und Kausalität gleich gesetzt werden, kann es schnell zu Trugschlüssen kommen.

Nachvollziehbarkeit algorithmischer Entscheidungssysteme

Software, die in der öffentlichen Verwaltung oder anderen gesellschaftssensiblen Bereichen eingesetzt wird, sollte demokratisch kontrollierbar sein. Transparenz allein, z.B. im Rahmen von öffentlichem Quellcode ("Open Source"), reicht dafür nicht aus. Deshalb geht es vor allem um die Erläuterung des Prozesses: Wie werden welche Daten von wem verarbeitet? Dies spielt auch eine wichtige Rolle bei lernenden Systemen, die zuerst mit Trainingsdaten "gefüttert" werden müssen.