Vorschlag und Erklärung für ein Datenbereinigungs- und Vorverarbeitungsskript
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
Profi-Leitfaden
Diese Eingabeaufforderung hilft Datenanalysten, unordentliche Datensätze effizient zu bereinigen und spart so mehr als 6 Stunden manuelle Datenvorverarbeitung.Durch die Eingabe von Datensatzproblemen generiert ChatGPT/Claude Schritt-für-Schritt-Bereinigungsskripte für Python (Pandas) und Excel mit Erläuterungen zum Zweck jedes Schritts und Validierungsprüfungen zur Sicherstellung der Datenqualität.Die Ausgabe macht Rätselraten bei der Datenbereinigung überflüssig und behebt häufige Probleme wie fehlende Werte, Duplikate, inkonsistente Formate und Text in numerischen Spalten.Es ist ideal für E-Commerce-, Gesundheits- und SaaS-Daten und funktioniert sowohl für kleine Excel-Datensätze als auch für große, mit Python verarbeitete Datensätze.Die Validierungsprüfungen stellen sicher, dass bereinigte Daten für die Analyse und Modellierung bereit sind.