データクリーニングと前処理スクリプトの提案と説明
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
導入ガイド
このプロンプトは、データ アナリストが乱雑なデータセットを効率的にクリーンアップするのに役立ち、手動のデータ前処理にかかる時間を 6 時間以上節約できます。データセットの問題を入力すると、ChatGPT/Claude は、Python (Pandas) と Excel の両方用のステップバイステップのクリーニング スクリプトを生成します。これには、各ステップの目的の説明と、データ品質を確保するための検証チェックが含まれます。この出力により、データ クリーニングにおける推測が排除され、欠損値、重複、一貫性のない形式、数値列のテキストなどの一般的な問題が解決されます。電子商取引、ヘルスケア、SaaS データに最適で、小規模な Excel データセットと大規模な Python 処理データセットの両方で機能します。検証チェックにより、クリーンアップされたデータが分析とモデリングの準備ができていることが確認されます。