Feuille d'ingénierie des fonctionnalités de prévision automatisée du taux de désabonnement des clients
Seed: CustomerActivity table with events, LastPurchaseDate, LifetimeValue; Feature columns: Recency = TODAY()-LastPurchaseDate, Frequency = COUNTIFS(CustomerEvents,CustomerID)ADVERTISEMENT - IN-ARTICLE
Guide d'exécution
Ce classeur d'ingénierie des fonctionnalités organise les prédicteurs courants utilisés pour la modélisation du taux de désabonnement et prépare un ensemble de données de formation adapté à l'apprentissage automatique.Il calcule les caractéristiques temporelles (récence, fréquence, durée d'occupation), les caractéristiques monétaires (valeur à vie, valeur moyenne des commandes), les signaux comportementaux (nombre de sessions, utilisation des fonctionnalités) et les agrégations dérivées (moyennes mobiles, pentes de tendance).La feuille comprend un regroupement automatisé (quantiles basés sur des cohortes), des aides à l'encodage ponctuels (indicateurs de catégorie) et une politique d'imputation des valeurs manquantes avec suivi d'audit pour les lignes imputées.Il exporte un CSV normalisé pour la modélisation et inclut un modèle de construction cible (par exemple, désabonnement dans les 30/90 prochains jours).Il existe également des instructions pour les backtests et les répartitions d'exclusion (basées sur le temps), ainsi qu'une convention de dénomination des colonnes pour prendre en charge les pipelines répétables.Utilisez ce classeur pour rapprocher les analystes et les data scientists, permettant une itération rapide sur des ensembles de fonctionnalités tout en préservant la provenance et la reproductibilité.