Was können soziale Netzwerke im Internet über Menschen wissen, die selbst kein Nutzerprofil besitzen, aber Freunde von Mitgliedern sind? Das haben Forscher des Interdisziplinären Zentrums für Wissenschaftliches Rechnen der Universität Heidelberg untersucht. Mit erstaunlichen Ergebnissen.
Die Wissenschaftler haben herausgefunden, dass sich Informationen aus der Netzwerkstruktur von Mitgliedern auf Nicht-Mitglieder übertragen und entsprechend auswerten können. Unter bestimmten Voraussetzungen ist es so möglich, etwa 40 Prozent der existierenden Freundschaftsbeziehungen zwischen Nicht-Mitgliedern auf der Basis reiner Kontaktdaten korrekt vorherzusagen.
Dass Mitglieder in sozialen Netzwerken unabsichtlich viel mehr über sich verraten, als ihnen lieb ist, hat sich bereits gezeigt. So haben Forscher ermittelt, dass in einem sozialen Netzwerk auch Angaben wie sexuelle Orientierung oder politische Ausrichtung, die ein Mitglied nicht selbst angegeben hat, mit sehr hoher Präzision »berechnet« werden, sofern genug Freunde des betreffenden Nutzers die entsprechende Information über sich selbst freigegeben haben. »Sobald bestätigte Freundschaftsbeziehungen bekannt sind, ist die Vorhersage bestimmter unbekannter Eigenschaften keine allzu große Herausforderung mehr für die maschinelle Datenanalyse«, sagt Prof. Dr. Fred Hamprecht, Mitbegründer des Heidelberg Collaboratory for Image Processing (HCI).
Untersuchungen dieser Art beschränken sich bislang jedoch auf Nutzer von sozialen Netzwerken. Doch In einem sozialen Netzwerk im Internet ist es auch möglich, unter anderem mit Hilfe einer Funktion zum Auffinden von Bekannten an Informationen über Nicht-Mitglieder zu gelangen. So werden Neumitglieder von Facebook dazu aufgefordert, bei ihrer Registrierung dem Netzwerk ihre kompletten E-Mail-Kontakte zur Verfügung zu stellen – auch Kontakte zu Personen, die selbst nicht Mitglied bei Facebook sind. »Dieses sehr grundlegende Wissen darüber, wer mit wem in einem sozialen Netzwerk bekannt ist, lässt sich mit Informationen darüber verknüpfen, wen Nutzer außerhalb des Netzwerks kennen. Mit dieser Verknüpfung kann dann wiederum ein wesentlicher Teil des Bekanntschaftsnetzes zwischen Nicht-Mitgliedern abgeleitet werden«, erläutert Ágnes Horvát, die am IWR forscht.
Da die Daten, die für diese Untersuchung benötigt wurden, nicht frei erhältlich sind, haben die Forscher mit einem Testset echter Grunddaten gearbeitet. Die Aufteilung in Mitglieder und Nicht-Mitglieder sollte dabei mit einer möglichst großen Bandbreite von Methoden simuliert werden. Mit der Simulation war es zugleich möglich, die Untersuchungsergebnisse zu validieren. Mit handelsüblichen Computern konnte in nur wenigen Tagen berechnet werden, welche Nicht-Mitglieder mit großer Wahrscheinlichkeit miteinander befreundet sind. »Unter realistischen Annahmen darüber, wieviel Prozent einer Bevölkerung Mitglied eines sozialen Netzwerkes sind und mit welcher Wahrscheinlichkeit diese ihr E-Mail-Adressbuch hochladen, hat sich gezeigt, dass es mit den Berechnungen möglich war, rund 40 Prozent richtige Vorhersagen über Bekanntschaften zwischen den Nicht-Mitgliedern zu treffen«.
Die Ergebnisse sind auch deshalb erstaunlich, weil sie auf der Auswertung von reinen Kontaktdaten beruhen. Viele soziale Netzwerke und Dienstleister verfügen jedoch über weitaus mehr Informationen der Nutzer, etwa Alter, Einkommen, Ausbildung oder Wohnort. Mit der Verwendung solcher Angaben, einer entsprechenden technischen Infrastruktur und weiteren Strukturmerkmalen der Netzwerkanalyse könnte man die Vorhersagegenauigkeit vermutlich noch einmal deutlich steigern.