데이터 정리 및 전처리 스크립트 제안 및 설명
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
전문 가이드
이 프롬프트는 데이터 분석가가 지저분한 데이터세트를 효율적으로 정리하여 수동 데이터 전처리에 소요되는 시간을 6시간 이상 절약하는 데 도움이 됩니다.데이터 세트 문제를 입력함으로써 ChatGPT/Claude는 Python(Pandas) 및 Excel 모두에 대한 단계별 정리 스크립트를 생성하며 각 단계의 목적에 대한 설명과 데이터 품질을 보장하기 위한 유효성 검사를 수행합니다.출력은 데이터 정리 시 추측을 제거하고 누락된 값, 중복, 일관되지 않은 형식, 숫자 열의 텍스트와 같은 일반적인 문제를 해결합니다.전자 상거래, 의료 및 SaaS 데이터에 이상적이며 소규모 Excel 데이터 세트와 대규모 Python 처리 데이터 세트 모두에서 작동합니다.검증 검사를 통해 정리된 데이터가 분석 및 모델링을 위한 준비가 되었는지 확인합니다.