Sugerencia y explicación de scripts de preprocesamiento y limpieza de datos
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
Guía de Implementación
Este mensaje ayuda a los analistas de datos a limpiar conjuntos de datos desordenados de manera eficiente, ahorrando más de 6 horas de preprocesamiento manual de datos.Al ingresar problemas del conjunto de datos, ChatGPT/Claude genera scripts de limpieza paso a paso tanto para Python (Pandas) como para Excel, con explicaciones del propósito de cada paso y verificaciones de validación para garantizar la calidad de los datos.El resultado elimina las conjeturas en la limpieza de datos y aborda problemas comunes como valores faltantes, duplicados, formatos inconsistentes y texto en columnas numéricas.Ideal para datos de comercio electrónico, atención médica y SaaS, funciona tanto para pequeños conjuntos de datos de Excel como para grandes conjuntos de datos procesados con Python.Las comprobaciones de validación garantizan que los datos limpios estén listos para el análisis y el modelado.