[정보처리기사 필기] 데이터 전환 - 093. 오류 데이터 측정 및 정제

1. 오류 데이터 측정 및 정제의 개요

  • 고품질의 데이터를 운영 및 관리하기 위해 수행
  • 순서 : 데이터 품질 분석 -> 오류 데이터 측정 -> 오류 데이터 정제

2. 데이터 품질 분석

  • 오류 데이터를 찾기 위해 원천 및 목적 시스템 데이터의 정합성 여부를 확인하는 작업
    • 정합성 : 데이터의 값이 서로 모순 없이 일관되게 일치하는 정도
  • 정합성 항목의 예시
    • 대표적인 원천 시스템 데이터의 정합성 항목
      • 필수 항목에 해당하는 데이터가 모두 있는가
      • 문자형, 숫자형, 날짜형 등 데이터의 유형은 올바르게 관리되는가
      • 날짜는 유효한 날짜 형태인가
      • 금액은 유효한 값의 범위인가
      • 계좌번호 또는 코드값은 정해진 규칙에 맞는 번호인가
      • 영업점은 실제 존재하는가
      • 업무 규칙에 위배되는 잘못된 정보는 없는가
      • 보고서 값과 실제 데이터 값이 일치하는가
      • 잔액은 회계 정보와 일치하는가
    • 대표적인 목적 시스템 데이터의 정합성 항목
      • 과목별 좌수 및 잔액
      • 특정 기준으로 분류된 좌수 및 잔액
      • 보고서 항목 또는 통계 수치
      • 계좌 및 고객을 샘플링하여 해당사항 확인
      • 특수 관계의 고객에 대한 데이터 확인

3. 오류 데이터 측정

  • 데이터 품질 분석을 기반으로 정상 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록을 작성하는 것
  • 측정 방법 
    • 정상 데이터 : 전환 대상 범위의 데이터를 업무 영역별, 테이블별로 구분하여 수량을 측정 및 기재
    • 오류 데이터 : 업무별로 오류 위치 및 유형을 확인하여 수량을 측정 및 기재

4. 오류 데이터 정제

  • 오류 관리 목록의 각 항목을 분석하여 원천 데이터를 정제하거나 전환 프로그램을 수정하는 것
  • 오류 데이터 분석
    • 오류 관리 목록의 오류 데이터를 분석하여 오류 상태, 심각도, 해결 방안을 확인 및 기재
    • 상태
      • Open : 오류가 보고만 되고 분석되지 않은 상태
      • Assigned : 오류의 영향 분석 및 수정을 위해 개발자에게 오류를 전달한 상태
      • Fixed : 개발자가 오류를 수정한 상태
      • Closed : 수정된 오류에 대해 테스트를 다시 했을 때 오류가 발견되지 않은 상태
      • Deferred : 오류 수정을 연기하는 상태
      • Classified : 보고된 오류를 관련자들이 확인했을 때 오류가 아니라고 확인된 상태
    • 심각도
      • 상 : 데이터 전환을 수행할 수 없는 오류
      • 중 : 데이터 전환 전반에 영향을 미치는 오류
      • 하 : 데이터 전환에 직접적인 영향을 미치지는 않으나 상황에 맞지 않는 용도 및 배치 오류
    • 해결방안
      • 수정 가능한 오류 : 오류의 해결 방안
      • 수정 불가능한 오류 : 고객과 협의하여 협의 결과를 기재
  • 오류 데이터 정제
    • 확인된 오류 데이터 분석을 통해 원천 데이터를 정제하거나 전환 프로그램을 수정
    • 오류 관리 목록의 예시
프로젝트 거래처 관리 시스템 재구축 프로젝트
시스템 고객 관리 시스템
순번 오류ID 정체ID 오류원인 해결방안 심각도 상태 발생일자 예상 해결일자 담당자
1 ER001 2019-123 고객 코드 미존재 코드 정보에 기업체 추가 Open 2019-10-25 9:30 2019-11-01 10:00 김선길