ADVERTISEMENT - LEADERBOARD

Détection automatisée des doublons et rapprochement des enregistrements maîtres

Seed: RawData with ID, Name, Email, Date; MasterKey with canonical IDs; Formula: fuzzy match using helper columns and scoring
ADVERTISEMENT - IN-ARTICLE

Guide d'exécution

Ce classeur fournit un flux de travail de réconciliation semi-automatisé pour détecter les doublons et mapper les enregistrements bruts aux ID principaux à l'aide d'une correspondance déterministe et floue.Commencez avec des clés déterministes (e-mail, carte d'identité nationale) via exact MATCH/XLOOKUP.Pour les quasi-doublons, calculez les champs normalisés (couper, réduire, supprimer la ponctuation) et utiliser la correspondance approximative de chaînes via des algorithmes d'assistance : distance de Levenshtein dans VBA ou correspondance approximative via INDEX/MATCH avec LEFT/N et les seuils de similarité.Créez une colonne de score de correspondance combinant les correspondances exactes, le chevauchement des jetons et la proximité des dates ;signalez les correspondances de confiance élevée pour la fusion automatique et présentez les candidats de faible confiance dans une feuille de révision.Incluez des journaux de rapprochement, des pistes d'audit et un processus incrémentiel qui écrit les fusions acceptées dans MasterKey.Cela réduit le nettoyage manuel et prépare les données pour les analyses en aval avec une intégrité élevée.
ADVERTISEMENT - STICKY