Automatisiertes Feature-Engineering-Blatt zur Prognose der Kundenabwanderung
Seed: CustomerActivity table with events, LastPurchaseDate, LifetimeValue; Feature columns: Recency = TODAY()-LastPurchaseDate, Frequency = COUNTIFS(CustomerEvents,CustomerID)ADVERTISEMENT - IN-ARTICLE
Profi-Leitfaden
Dieses Feature-Engineering-Arbeitsbuch organisiert gängige Prädiktoren, die für die Abwanderungsmodellierung verwendet werden, und bereitet einen Trainingsdatensatz vor, der für maschinelles Lernen geeignet ist.Es berechnet zeitliche Merkmale (Aktualität, Häufigkeit, Amtszeit), monetäre Merkmale (Lebenszeitwert, durchschnittlicher Bestellwert), Verhaltenssignale (Sitzungsanzahl, Funktionsnutzung) und abgeleitete Aggregationen (gleitende Durchschnitte, Trendsteigungen).Das Blatt umfasst automatisiertes Bucketing (kohortenbasierte Quantile), One-Hot-Codierungshilfsmittel (Kategorie-Flags) und eine Richtlinie zur Imputation fehlender Werte mit Audit-Tracking für imputierte Zeilen.Es exportiert eine normalisierte CSV-Datei zur Modellierung und enthält eine Zielkonstruktionsvorlage (z. B. Abwanderung in den nächsten 30/90 Tagen).Es gibt auch Anweisungen für Backtesting und Holdout-Splits (zeitbasiert) sowie eine Spaltenbenennungskonvention zur Unterstützung wiederholbarer Pipelines.Verwenden Sie diese Arbeitsmappe, um eine Brücke zwischen Analysten und Datenwissenschaftlern zu schlagen und eine schnelle Iteration von Funktionssätzen zu ermöglichen, während Herkunft und Reproduzierbarkeit erhalten bleiben.
💡 Fragen & Antworten
Q: \F: Wie vermeide ich Ziellecks?\" \"
Definieren Sie das Zielfenster klar und berechnen Sie Features nur aus Daten vor dem Zielstartdatum;Fügen Sie für jede Zeile eine Spalte mit dem Fixierungsdatum ein, um dies durchzusetzen.\" \n\"F: Kann dies für die Echtzeitbewertung verwendet werden?\" \"