Предложение и объяснение сценария очистки и предварительной обработки данных
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
Руководство
Эта подсказка помогает аналитикам данных эффективно очищать беспорядочные наборы данных, экономя более 6 часов ручной предварительной обработки данных.Вводя проблемы с набором данных, ChatGPT/Claude генерирует пошаговые сценарии очистки как для Python (Pandas), так и для Excel, с объяснениями цели каждого шага и проверочными проверками для обеспечения качества данных.Вывод исключает необходимость догадок при очистке данных, устраняя распространенные проблемы, такие как пропущенные значения, дубликаты, несовместимые форматы и текст в числовых столбцах.Идеально подходит для данных электронной коммерции, здравоохранения и SaaS, он работает как с небольшими наборами данных Excel, так и с большими наборами данных, обработанными Python.Проверки валидации гарантируют, что очищенные данные готовы к анализу и моделированию.