2017/06/15 2

[기고] 데이터 품질 보장과 애플리케이션 성능 확보 사이에서

▶ 데이터 중복 메커니즘과 활용 (上) 데이터 중복 특성과 적용전 회에서는 데이터 중복의 필요성과 대응 방안을 논하였다. 데이터 중복이 완전히 제거된 상태로 정보시스템을 구축하는 것이 가장 이상적이지만, 성능 확보를 위해 피할 수 없는 선택이라면 그 특성을 이해하고 적용할 필요가 있다. 이번 회에서는 데이터 중복 방식, 중복 방향, 컬럼 유형별 중복 제약사항 등을 살펴보고자 한다. 참고로, 본 기고에서 언급하는 데이터 중복의 범위는 동일한 데이터베이스 내에서의 중복에 한정함을 밝혀둔다. Data Warehouse 구축 등을 위해 타 데이터베이스로의 복제 등도 넓게 해석하면 데이터 중복이라고 할 수 있으나 본 기고에서는 다루지 않는다. 1. 데이터 중복 방식 데이터는 값에 대한 변형 없이 다른 위치에 복제..

[솔루션 리뷰] 데이터 품질관리 솔루션 SDQ

최근 들어, 빅데이터에 대한 관심으로 데이터의 중요성에 대한 인식이 점차 높아지고, 이를 효과적으로 분석하고 활용하기 위해서는 데이터 품질이 선결요건으로 이해되기 시작했습니다. 특히 공공기관의 경우는 국가 차원의 공공정보 공개, 개방에 대한 정책 추진과 맞물려 품질관리에 대한 관심과 투자가 점차 높아지고 있는 추세입니다. 고품질 데이터 활용에 대한 공감대가 형성되는 상황에서 전사 차원의 산재되어 있는 데이터를 효율적으로 관리하는데 도움을 주는 ‘SDQ’에 대해 설명합니다. 1. SDQ는SDQ는 데이터 품질관리 솔루션으로 스케줄러와 프로파일링 프로세스를 이용하여 진단 룰을 간편하게 적용하고 실행할 수 있습니다. 또한, ‘DQ’ 기능과 ‘META’ 기능의 통합으로 데이터 값 진단 이외에 데이터표준, 데이터구..