Unsupervised Learning auf Nutzungssequenzen von Paid-Content Abonennten

Mit Hilfe eines Unsupervised Learning Verfahrens aus der DNA bzw. Lebenslaufforschung (Optimal Matching) konnten Nutzungssequenzen von Paid-Content Probe-Abonnenten erfolgreich strukturiert und geclustert werden. Die eingesetzte Levenshtein-Distanz Variante (OMspell) brachte selbst bei kleinsten Fallzahlen von n=38 vier recht homogene Gruppen zu Tage.   

Eingesetzt wurde der Algorithmus bei einer Online-Tagebuchstudie für den Fränkischen Tag, in der täglich die Nutzung von E-Paper und Plus-Artikeln eingetragen wurde. Ein vielversprechender Ansatz der im digitalen Raum folgende Herausforderungen lösen könnte:

  1. Identifikation schwächelnder Nutzer könnten zur Churn-Prävention identifizieren.
  2. Notorisch nicht-repräsentative Onsite-Daten könnten „Cluster-Repräsentanten“ zugeordnet werden, um das Targeting zu verbessern.
  3. Nutzer-IDs zur Profilierung matchen.

Eingesetzt wurde das Package TramineR in R-Stats. Technische Details gebe ich gerne auf Nachfrage!

Share your thoughts