19.04.2021 Diverses

Facebook: Was die Plattform gegen Scraping unternimmt

Facebook beschäftigt ein über 100-köpfiges Team, um Datenmissbrauch wie Scraping zu unterbinden. Dies ist nicht immer so einfach, wie ein kurzer Einblick ins Thema zeigt.

Kai Thrun
3 Min. Lesezeit
Keine Kommentare

Nachdem ein Datensatz mit über 570 Millionen Einträgen im Netz angeboten wurde, ist Scraping ein durchaus bekannter Fachbegriff. In unserem Artikel dazu, haben wir beleuchtet, was Scraping ist und wieso es kaum verhindert werden kann. Facebook hat dazu ebenfalls Stellung bezogen.

Was ist Scraping?

Wie im vorherigen Artikel beschrieben, ist Scraping kurz gesagt, das Lesen von Daten und Fakten auf Webseiten oder in Apps. Dieser Vorgang kann autorisiert als auch unautorisiert sein. Ein einfaches Beispiel für Scraping ist das Sammeln von Informationen der Suchmaschinen, was als Crawling bezeichnet wird. Der Vorgang ist identisch. Ein Webcrawler geht auf eine Webseite und liest die relevanten Informationen aus, ordnet sie zu und sortiert sie in seine Datenbank. Fertig ist in dem Fall ein Suchtreffer bei zukünftigen Suchen. Diese Datenbanken sind es, die dann angeboten werden.

Unvermeidbar, aber anfechtbar

Das automatische Abschöpfen von Daten ist nur schwer vermeidbar und nie zu 100 Prozent auszuschliessen. Es ist zwar in den Nutzungsbedingungen untersagt, aber wer illegal Millionen von Datensätzen sammeln will, lässt sich nicht mit einer Textpassage davon abhalten.
Auch das Scraping ist schlauer geworden. Scraper versuchen heutzutage, sich unter das Publikum zu mischen und ein natürliches Nutzerverhalten nachzuahmen. Aus diesem Grund ist es für Facebook komplexer, sie zu entdecken. Es gibt verschiedene Methoden, um die autorisierten Zugriffe von echten Personen, von denen, die durch Programme getätigt werden, zu unterscheiden.

Was unternimmt Facebook gegen Scraping?

Um unautorisiertes Scraping auf der Plattform beziehungsweise allen Produkten zu bekämpfen, hat Facebook ein spezielles Team: External Data Misuse, kurz EDM. Das Team besteht aus mehr als 100 Mitarbeitern, welches sich aus Datenwissenschaftlern, Analysten und Ingenieuren zusammen setzt, um Scraping zu erkennen, zu blockieren und zu verhindern.

Das Team versucht in seiner Arbeit eine Balance zu finden. Während illegale Akteure versuchen, ein möglichst natürliches Verhalten an den Tag zu legen, müssen diese von echten Menschen unterschieden werden. Die reibungslose Nutzung der Plattform darf dabei nicht beeinträchtigt werden. Es ist also nicht so einfach, wie es scheint.

Ein recht naheliegender Schritt sind Limits, die eingehalten werden müssen. Wer einmal x-fach einen Weihnachtsgruss verschickt hat, wird vielleicht auf eine Pause gestossen sein, da er zu viele Nachrichten in zu kurzer Zeit verschickt hat. Das ist zwar ein Limit gegen Spam, allerdings ist der Vorgang ähnlich. Der Zugriff auf Daten oder die Interaktion mit der Plattform wird auf bestimmte Zeiträume limitiert. Natürlich weiss Facebook, dass es Scraper nicht abhalten wird neue Wege zu finden. Es ist ein erster und logischer Schritt, um nicht Tor und Hof für das Abschöpfen der Daten zu öffnen.

Über weitere Massnahmen hält sich Facebook bedeckt. Es werden sowohl rechtliche Schritte eingeleitet als auch Hoster kontaktiert, die die Daten unwissentlich auf ihren Servern lagern. So wie die Daten, die nun die Runde machten. Hier wird überprüft, wo und in welchen Foren diese Daten angeboten werden, wo Datensätze und Datensatzfragmente abgelegt sind, um dann mit den jeweiligen Hostern zusammenzuarbeiten und die Dateien zu entfernen.

Was können wir als Plattformbesucher tun?

Gegen Scraping kann selbst wenig unternommen werden. Es sollten jedoch Privatsphäre-Einstellungen regelmässig überprüft werden als auch, welche Daten unbedingt öffentlich sein müssen. Weitere Hilfestellung zu Sicherheitseinstellungen sind in den folgenden Beiträgen festgehalten:

Sicherheitsempfehlungen – Teil 1
Sicherheitsempfehlungen – Teil 2

Fazit

Scraping kann nicht verhindert werden und es wird Facebook ein leidiges Thema sein. Klar, es ist in den Nutzungsbedingungen untersagt, aber wen soll das abhalten? Es schafft nur eine rechtliche Grundlage. Die Anstrengungen sind notwendig, die die Plattform unternimmt, damit das Thema nicht aus dem Ruder läuft. Es wird im Gesamtkontext wesentlich komplexer sein, als es sich darstellt. Insgesamt für alle Beteiligten eines Leaks kein Vergnügen.

Facebook Instagram Twitter LinkedIn Xing TikTok

Kommentar via Facebook

Bitte akzeptieren Sie die Cookies um die Facebook Kommentare zu nutzen.

Schreib uns einen Kommentar

Möchtest Du immer auf dem neusten Stand mit unseren Newsletter sein?

Melde Dich jetzt an