Hoja de ingeniería de funciones de predicción automatizada de la pérdida de clientes
Seed: CustomerActivity table with events, LastPurchaseDate, LifetimeValue; Feature columns: Recency = TODAY()-LastPurchaseDate, Frequency = COUNTIFS(CustomerEvents,CustomerID)ADVERTISEMENT - IN-ARTICLE
Guía de Implementación
Este libro de trabajo de ingeniería de funciones organiza los predictores comunes utilizados para el modelado de abandono y prepara un conjunto de datos de entrenamiento adecuado para el aprendizaje automático.Calcula características temporales (reciente, frecuencia, antigüedad), características monetarias (valor de vida, valor promedio de pedido), señales de comportamiento (recuento de sesiones, uso de funciones) y agregaciones derivadas (promedios móviles, pendientes de tendencia).La hoja incluye agrupamiento automatizado (cuantiles basados en cohortes), ayudantes de codificación one-hot (indicadores de categoría) y una política de imputación de valores faltantes con seguimiento de auditoría para las filas imputadas.Exporta un CSV normalizado para modelado e incluye una plantilla de construcción de objetivos (por ejemplo, abandono en los próximos 30/90 días).También hay instrucciones para realizar pruebas retrospectivas y divisiones de reserva (basadas en el tiempo), además de una convención de nomenclatura de columnas para admitir canalizaciones repetibles.Utilice este libro de trabajo para unir a los analistas y científicos de datos, permitiendo una iteración rápida en conjuntos de características y al mismo tiempo preservando la procedencia y la reproducibilidad.