ADVERTISEMENT - LEADERBOARD

Suggérateur et explication de script de nettoyage et de prétraitement des données

Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.
ADVERTISEMENT - IN-ARTICLE

Guide d'exécution

Cette invite aide les analystes de données à nettoyer efficacement les ensembles de données désordonnés, économisant ainsi plus de 6 heures de prétraitement manuel des données.En saisissant les problèmes d'ensemble de données, ChatGPT/Claude génère des scripts de nettoyage étape par étape pour Python (Pandas) et Excel, avec des explications sur le but de chaque étape et des contrôles de validation pour garantir la qualité des données.Le résultat élimine les approximations lors du nettoyage des données, résolvant les problèmes courants tels que les valeurs manquantes, les doublons, les formats incohérents et le texte dans les colonnes numériques.Idéal pour les données de commerce électronique, de santé et SaaS, il fonctionne aussi bien pour les petits ensembles de données Excel que pour les grands ensembles de données traités par Python.Les contrôles de validation garantissent que les données nettoyées sont prêtes pour l'analyse et la modélisation.
ADVERTISEMENT - STICKY