21.10.2020 LinkedIn

LinkedIn: So funktioniert das intelligente Empfehlungssystem

Wie funktioniert ein intelligentes Empfehlungssystem? Im folgenden Beitrag wird erklärt, wie der LinkedIn SPR-Algorithmus funktioniert und welche Auswirkung der Algorithmus auf das persönliche Netzwerk eines Mitgliedes hat.

Stephanie Hillig
6 Min. Lesezeit
Keine Kommentare

Sich mit “Personen, die Sie vielleicht kennen” zu verbinden, ist eine der bekanntesten und beliebtesten LinkedIn-Funktionen und wird weltweit von zahlreichen Mitgliedern genutzt, um sich mit anderen Mitgliedern zu verbinden und so das eigene Netzwerk auszubauen. Da die Netzwerke der Mitglieder aber zunehmend heterogener werden, hat sich diese Funktion zu einer Art Connection-Oberfläche “Ihr Netzwerk” entwickelt, wo Mitgliedern nebst Personen auch Hashtags, Firmen, Gruppen, Newsletter und Veranstaltungsempfehlungen angezeigt werden. So können sich Mitglieder also mit einem anderen Mitglied verbinden, einem Hashtag, einer Firma oder einem einflussreichen Content-Creator folgen und einen Newsletter, eine Gruppe oder eine Veranstaltung abonnieren. Handeln Mitglieder nach diesen Empfehlungen, fügen sie dem Diagramm, das ihr soziales Netzwerk darstellt, Schnittstellen hinzu. Da sich Mitglieder zunehmend auch an LinkedIn wenden, um eine Gemeinschaft aufzubauen und sich über berufliche Neuigkeiten auf dem Laufenden zu halten, können diese Schnittstellen Mitgliedern helfen, Zugang zu relevanten Inhalten zu erhalten und aktive Gemeinschaften zu bilden, mit denen sie sich regelmässig austauschen können.

Wie unterscheiden sich diese Schnittstellen?

Diese heterogenen Schnittstellen sind von unterschiedlichem Charakter und dienen der Befriedigung unterschiedlichen Nutzerbedürfnisse. Eine Verbindungs-Schnittstelle ist zweiseitig resp. bidirektional, sodass sowohl der Initiant der Schnittstelle als auch der Empfänger Zugriff auf die Inhalte des jeweils anderen hat. Auf der anderen Seite sind Follow- resp. Subscribe-Schnittstellen unidirektional, sodass lediglich der Initiant Zugang zu Inhalten anderer Unternehmen, Hashtags, Content-Creator, Gruppen, Newsletter und Veranstaltungen hat. Die Empfehlungen auf der “Ihr Netzwerk”-Oberfläche sollen Mitgliedern helfen sich selbst ein heterogenes soziales Netzwerk aufzubauen, das sowohl aus bidirektionalen als auch aus unidirektionalen Verbindung besteht und bei den Empfehlungen die Interessen, Verhaltensweisen und Umstände eines Mitgliedes und seines bestehenden Netzwerks berücksichtigt.

"Ihr Netzwerk" Muster LinkedIn

Die Registerkarte “Ihr Netzwerk” mit heterogenen Empfehlungen wie
“Menschen, mit denen Sie vielleicht gearbeitet haben” ist eine Zusammenstellung von Empfehlungen von Menschen, zu denen ein Betrachter Verbindungen herstellen kann, während “Menschen, die über #datascience schreiben” eine Sammlung von relevanten Beiträgen einflussreicher Content-Creator ist.
Quelle: LinkedIn

Zwei-Phasen-Empfehlungen

Angesichts der Heterogenität der verschiedenen Schnittstellen folgt die Einstufung dieser Empfehlungen in der Regel in einem zweiphasigen Prozess:

Einstufung der Empfehlungen eines Typs untereinander:
Für die obige Abbildung würde dies bedeuten, dass die Personenempfehlungen “Judy”, “Cheri”, “Radha” und “Marcel” in eine Rangfolge gebracht wurden. Dies geschieht in der Regel über Ranglistenmodelle, die in der Fachterminologie Edge-FPR-Modelle (Edge First Pass Ranker) genannt werden.

Einstufung der heterogenen Schnittstellen-Empfehlungen untereinander:
Zum Beispiel: Ranking einer Zusammenstellung von Ereignissen vs. einer Zusammenstellung von Personenempfehlungen vs. einer Zusammenstellung von Newslettern. Dies erleichtert den Prozess, bei dem ein Mitglied die nächste Schnittstelle zur Vergrösserung seines Netzwerks auswählt. Hierfür verwendet LinkedIn sein eigenes Second-Pass-Ranking (SPR)-Empfehlungssystem.

LinkedIn Empfehlungssystem

Visualisierung des SPR-Empfehlungssystems unter Einbezug des Edge-FPR-Modells.
Quelle: LinkedIn

Entwicklung eines Empfehlungssystems

Die Entwicklung eines solchen Empfehlungssystems ist mit drei wesentlichen Herausforderungen verbunden:

  1. Die Edge-FPR-Modelle sind separate und unabhängige KI-Modelle, die verschiedene Algorithmen wie XGBoost, logistische Regression und tiefe neuronale Netze nutzen können. Diese Modelle machen sich das Domänenwissen zunutze, wodurch sie für verschiedene Geschäftskennzahlen optimiert werden können und sogar Scores auf einer anderen Skala generieren können. Um ein konsistentes Ranking über die heterogenen Einheiten hinweg zu erzeugen, müssen daher die Edge-FPR-Modell-Scores kalibriert werden, damit sie vergleichbar werden.
  2. Die Verteilung der Trainingsdaten gibt nicht zwingend einen Aufschluss über den relativen Wert der verschiedenen Arten von Schnittstellen und weicht möglicherweise erheblich von der Idealverteilung ab. Darüber hinaus müssen beim Ranking unterschiedliche Geschäftsanforderungen und Einschränkungen berücksichtigt werden. Infolgedessen könnte eine einheitliche Rangfolge der Schnittstellen, die den wahren relativen Wert der Schnittstellen ignoriert, auf der Bewertungsebene des zweiten Durchgangs dazu führen, dass bestimmte Schnittstellentypen unverdient eine höhere oder niedrigere Bedeutung erhalten.
  3. Die Konzeption der Korrelation zwischen Edge-FPR-Modellen und SPR ist komplex und erfordert ein sorgfältiges Abwägen zwischen Modellpräzision und Entwicklungsagilität. Um das Gesamtsystem zu verbessern, müssen Edge-FPR-Modelle und SPR regelmässig durch A/B-Tests iteriert werden. Dabei muss berücksichtigt werden, dass eine präzise Abstimmung zwischen Edge-FPR-Modellen und SPR zwar eine etwas höhere Genauigkeit erzielen kann, sich dies jedoch wiederum auf die Iterationsgeschwindigkeit auswirken kann.

Der LinkedIn SPR-Algorithmus in Kürze

Mittels eines XGBoost-Modells, das die Wahrscheinlichkeit von Downstream-Interaktionen eines Mitglieds mit Top-k-Empfehlungen (Empfehlungen, welche die ersten k Positionen innerhalb einer Zusammenstellung einnehmen) vorhersagt und eben diese dann anhand des Wahrscheinlichkeitsscores einordnet. Eine Gemeinsamkeit, ein Kommentar oder ein erneuter Austausch von Inhalten, der aus der Empfehlung heraus entstanden ist, werden als nachgelagerte Interaktion gezählt. Bei einer Verbindungsschnittstelle wären dies also die Anzahl der Gemeinsamkeiten, Kommentare oder ein erneuter Austausch von Inhalten, die durch die Verbindung entstanden sind. Dieses Modell wird mit binären Labels gegen einen logistischen Verlust abgesichert (entsprechend der Frage, ob es eine Downstream-Interaktion gab oder nicht) und verwendet kalibrierte Scores von Edge-FPRs als zusätzliche Merkmale zu den anderen Merkmalen auf Mitgliederebene. Darüber hinaus werden auch gegensätzlich wirkende Ansätze entworfen, um die relative Wichtigkeit jedes Schnittstellentyps abzuschätzen, die mit den Scores der entsprechenden Zusammenstellungen multipliziert werden.

Schematischer Aufbau von SPR

Schematischer Aufbau des SPR-Algorithmus.
Quelle: LinkedIn.

Modell-Gleichung

Gleichung

Quelle: LinkedIn.

Formel zur Berechnung der Wahrscheinlichkeit eines ähnlichen Kommentars oder einer vergleichbaren Gemeinsamkeit.

LinkedIn prognostiziert die Wahrscheinlichkeit (P) einer Downstream-Interaktion unter Verwendung aggregierter und kalibrierter FPR-Scores sowie unter Einbezug von Mitgliedermerkmalen. Dazu gehören profilbasierte Merkmale, Aktivitätsmerkmale und die Einbindung neuronaler Netzwerken, welche die Netzwerktopologie eines Mitglieds erfassen. Um Edge-FPR-Scores in die Empfehlungsebene zu konvertieren wird eine Aggregationsfunktion eingesetzt.

Ergebnisse und nächste Schritte

Um die Auswirkungen des SPR-Systems zu messen, führte LinkedIn A/B-Tests durch, die einen Anstieg interagierender Mitglieder und eine signifikante Zunahme der darauffolgenden Interaktionen zeigten. Das neue System führte dazu, dass mehr Mitglieder neue Schnittstellen erstellten sowie Interaktionen mit oder über diese Schnittstellen führten.
Ein bemerkenswerter Effekt, der LinkedIn bei Tests ihres heterogenen Empfehlungssystems aufgefallen ist, dass die Bildung bestimmter Schnittstellentypen zum Nachteil anderer Typen ausfallen kann. Das heisst, dass es zwar insgesamt zu einem Anstieg an Schnittstellen und Interaktionen der Mitglieder kommen kann, doch die Verteilung dieses Anstiegs auf die verschiedenen Schnittstellentypen von den Besonderheiten des SPR-Algorithmus abhängt. Dieser ist so konzipiert, dass er zwingend die Spezifikationen der einzelnen Schnittstellentypen erfüllen muss. Da es bei den Interaktionen der Mitglieder ebenfalls eine Heterogenität gibt, führt dies dazu, dass aktivere Mitglieder kontinuierlich qualitativ hochwertige Daten liefern, was im Umkehrschluss bedeutet, dass inaktive Mitglieder kaum qualitativ hochwertige Empfehlungen ausgespielt bekommen. LinkedIn plant, sich in Zukunft noch intensiver mit diesen Einschränkungen auseinanderzusetzen und weiterhin in ihr intelligentes Empfehlungssystem zu investieren, mit dem Ziel, ganzheitlichere und aktivere Netzwerke auf LinkedIn aufzubauen.

Fazit

Bei der Bildung eines Netzwerkes sollte die Devise im Idealfall Qualität vor Quantität lauten. Der LinkedIn SPR-Algorithmus bietet hier grosses Potenzial: Intelligente Empfehlungen, basierend auf den eigenen Interaktionen sowie denen der bestehenden Schnittstellen. Vereinfacht gesagt bedeutet das nichts anderes als, dass die Qualität des Empfehlungssystems in direkter Abhängigkeit zur Interaktionsqualität eines Mitglieds und seiner bestehenden Schnittstellen steht. Wer sein Netzwerk transparent, bedacht sowie auf realen Interessen und Verbindungen basierend aufbaut, profitiert. Die Qualität der Empfehlungen steigt und wird somit aussagekräftiger.
Interaktionen werden auf LinkedIn allerdings nach wie vor als Faktor für Relevanz gewichtet. Ein klarer Nachteil für aktive Mitglieder, welche sich in einem thematisch heterogenen Netzwerke bewegen. Für diese Mitglieder bietet sich kaum eine Chance, Empfehlungen zu erhalten, die ihre persönlichen Interessen berücksichtigen.

Facebook Instagram LinkedIn

Kommentar via Facebook

Bitte akzeptieren Sie die Cookies um die Facebook Kommentare zu nutzen.

Schreib uns einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Kennst Du schon unsere wöchentlichen Newsletter?

Facebook & Instagram   LinkedIn