Sugestão e explicação de script de limpeza e pré-processamento de dados
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
Guia Profissional
Esse prompt ajuda os analistas de dados a limpar conjuntos de dados confusos com eficiência, economizando mais de 6 horas de pré-processamento manual de dados.Ao inserir problemas de conjunto de dados, ChatGPT/Claude gera scripts de limpeza passo a passo para Python (Pandas) e Excel, com explicações da finalidade de cada etapa e verificações de validação para garantir a qualidade dos dados.A saída elimina suposições na limpeza de dados, abordando problemas comuns como valores ausentes, duplicatas, formatos inconsistentes e texto em colunas numéricas.Ideal para dados de comércio eletrônico, saúde e SaaS, funciona tanto para pequenos conjuntos de dados Excel quanto para grandes conjuntos de dados processados em Python.As verificações de validação garantem que os dados limpos estejam prontos para análise e modelagem.