الكشف الآلي عن التكرارات وتسوية السجلات الرئيسية
Seed: RawData with ID, Name, Email, Date; MasterKey with canonical IDs; Formula: fuzzy match using helper columns and scoringADVERTISEMENT - IN-ARTICLE
دليل احتراfi
يوفر هذا المصنف سير عمل تسوية شبه تلقائي للكشف عن التكرارات وتعيين السجلات الأولية للمعرفات الرئيسية باستخدام المطابقة الحتمية والغامضة.ابدأ بالمفاتيح الحتمية (البريد الإلكتروني، الهوية الوطنية) عبر MATCH/XLOOKUP الدقيق.بالنسبة للتكرارات القريبة، قم بحساب الحقول المقيسة (القص، والخفض، وإزالة علامات الترقيم) واستخدم مطابقة السلسلة التقريبية عبر خوارزميات المساعدة: مسافة Levenshtein في VBA أو المطابقة التقريبية عبر INDEX/MATCH مع LEFT/N وعتبات التشابه.أنشئ عمودًا لنتيجة المطابقة يجمع بين التطابقات التامة وتداخل الرموز المميزة وقرب التاريخ؛قم بوضع علامة على المطابقات عالية الثقة للدمج التلقائي وقدم المرشحين ذوي الثقة المنخفضة في ورقة المراجعة.قم بتضمين سجلات التسوية ومسارات التدقيق والعملية المتزايدة التي تكتب عمليات الدمج المقبولة إلى MasterKey.وهذا يقلل من التنظيف اليدوي ويجهز البيانات للتحليلات النهائية بنزاهة عالية.
💡 الأسئلة الشائعة
Q: \
هل يمكن أن يصل هذا إلى 100 ألف صف؟\" \"ج: Pure Excel له حدود؛استخدم Power Query للمجموعات الكبيرة