자동화된 중복 감지 및 마스터 레코드 조정
Seed: RawData with ID, Name, Email, Date; MasterKey with canonical IDs; Formula: fuzzy match using helper columns and scoringADVERTISEMENT - IN-ARTICLE
전문 가이드
이 통합 문서는 결정적 일치와 퍼지 일치를 사용하여 중복을 감지하고 원시 레코드를 마스터 ID에 매핑하는 반자동 조정 워크플로를 제공합니다.정확한 MATCH/XLOOKUP을 통해 결정적 키(이메일, 주민등록번호)로 시작하세요.거의 중복된 항목의 경우 정규화된 필드(자르기, 낮추기, 구두점 제거)를 계산하고 도우미 알고리즘을 통해 대략적인 문자열 일치를 사용합니다. VBA의 Levenshtein 거리 또는 LEFT/N이 있는 INDEX/MATCH 및 유사성 임계값을 통한 대략적인 일치입니다.정확한 일치, 토큰 중복 및 날짜 근접성을 결합한 일치 점수 열을 만듭니다.자동 병합을 위해 신뢰도가 높은 일치 항목을 표시하고 검토 시트에 신뢰도가 낮은 후보를 제시합니다.조정 로그, 감사 추적 및 승인된 병합을 MasterKey에 기록하는 증분 프로세스를 포함합니다.이를 통해 수동 정리 작업이 줄어들고 높은 무결성으로 다운스트림 분석을 위한 데이터를 준비할 수 있습니다.
💡 질문 및 답변
Q: \
10만 행까지 확장할 수 있나요?\" \"