Unsupervised Learning auf Nutzungssequenzen von Paid-Content Abonennten

Februar 7, 2023

Mit Hilfe eines Unsupervised Learning Verfahrens aus der DNA bzw. Lebenslaufforschung (Optimal Matching) konnten Nutzungssequenzen von Paid-Content Probe-Abonnenten erfolgreich strukturiert und geclustert werden. Die eingesetzte Levenshtein-Distanz Variante (OMspell) brachte selbst bei kleinsten Fallzahlen von n=38 vier recht homogene Gruppen zu Tage.

Eingesetzt wurde der Algorithmus bei einer Online-Tagebuchstudie für den Fränkischen Tag, in der täglich die Nutzung von E-Paper und Plus-Artikeln eingetragen wurde. Ein vielversprechender Ansatz der im digitalen Raum folgende Herausforderungen lösen könnte:

Identifikation schwächelnder Nutzer könnten zur Churn-Prävention identifizieren.
Notorisch nicht-repräsentative Onsite-Daten könnten „Cluster-Repräsentanten“ zugeordnet werden, um das Targeting zu verbessern.
Nutzer-IDs zur Profilierung matchen.

Eingesetzt wurde das Package TramineR in R-Stats. Technische Details gebe ich gerne auf Nachfrage!

Share your thoughts Antworten abbrechen