تنظيف البيانات والمعالجة المسبقة، مقترح وشرح النص البرمجي
Act as a data engineer specializing in Python and Excel data cleaning. Provide step-by-step data cleaning scripts and explanations for the following messy dataset: [snippet: e-commerce customer data with missing values in Order_Value, duplicate Customer_IDs, inconsistent date formats (MM/DD/YYYY vs. DD-MM-YYYY), and text strings in numerical columns]. For both Python (Pandas) and Excel, provide: 1) Script/ formula steps to fix each issue, 2) Explanation of why each step is necessary, 3) Validation checks to ensure data quality post-cleaning.ADVERTISEMENT - IN-ARTICLE
دليل احتراfi
تساعد هذه المطالبة محللي البيانات على تنظيف مجموعات البيانات الفوضوية بكفاءة، مما يوفر أكثر من 6 ساعات من المعالجة المسبقة اليدوية للبيانات.من خلال إدخال مشكلات مجموعة البيانات، يقوم ChatGPT/Claude بإنشاء برامج نصية للتنظيف خطوة بخطوة لكل من Python (Pandas) وExcel، مع توضيحات لغرض كل خطوة وعمليات التحقق من الصحة لضمان جودة البيانات.يزيل الإخراج التخمين في تنظيف البيانات، ويعالج المشكلات الشائعة مثل القيم المفقودة والتكرارات والتنسيقات غير المتسقة والنص في الأعمدة الرقمية.مثالي للتجارة الإلكترونية والرعاية الصحية وبيانات SaaS، وهو يعمل مع كل من مجموعات بيانات Excel الصغيرة ومجموعات البيانات الكبيرة المعالجة بواسطة Python.تضمن عمليات التحقق من الصحة أن البيانات التي تم تنظيفها جاهزة للتحليل والنمذجة.