Detecção automatizada de duplicatas e reconciliação de registros mestres
Seed: RawData with ID, Name, Email, Date; MasterKey with canonical IDs; Formula: fuzzy match using helper columns and scoringADVERTISEMENT - IN-ARTICLE
Guia Profissional
Esta pasta de trabalho fornece um fluxo de trabalho de reconciliação semiautomático para detectar duplicatas e mapear registros brutos para IDs mestres usando correspondência determinística e difusa.Comece com chaves determinísticas (e-mail, ID nacional) via MATCH/XLOOKUP exato.Para quase duplicatas, calcule campos normalizados (aparar, diminuir, remover pontuação) e usar correspondência aproximada de string por meio de algoritmos auxiliares: distância de Levenshtein em VBA ou correspondência aproximada via INDEX/MATCH com LEFT/N e limites de similaridade.Crie uma coluna de pontuação combinando correspondências exatas, sobreposição de token e proximidade de data;sinalizar correspondências de alta confiança para mesclagem automática e apresentar candidatos de baixa confiança em uma planilha de revisão.Inclua logs de reconciliação, trilhas de auditoria e um processo incremental que grava mesclagens aceitas no MasterKey.Isso reduz a limpeza manual e prepara os dados para análises downstream com alta integridade.