비투엔 기술기고

[기고] 4차 산업혁명 시대의 공공데이터 품질관리

알 수 없는 사용자 2017. 11. 7. 15:45





4차 산업혁명 시대에 '데이터'의 가치가 조명을 받고 있다. 4차 산업혁명은 인공지능(AI), 사물인터넷, 빅데이터, 모바일 등 첨단 정보통신기술이 경제·사회 전반에 융합되어 혁신적이 변화가 나타나는 시대로 사람, 사물, 공간이 네트워크로 연결돼 하나의 통합 시스템으로 구축된다


데이터는 인공지능(AI), 빅데이터, 클라우드 등 4차  산업혁명의 주요 기술을 움직이는 동력이며, 얼마나 많은 데이터를 보유·분석하느냐가 4차 산업혁명 시대에 국가와 기업의 경쟁력을 좌우 한다고 볼 수 있다.




[그림1] 4차 산업혁명의 데이터의 역할 _ 출처: 미래창조과학 블로그



공공데이터란 공공기관이 생성하거나 관리하고 있는 자료 또는 정보로써, 기관이 업무를 수행하며 만들어낸 다양한 형태(텍스트, 수치, 이미지, 동영상, 오디오)의 모든 자료 또는 정보를 말한다. 각국 정부는 수십년간 쌓아온 데이터를 보유하고 있으며, 미국, 영국, 일본 등 주요 국가는 정부가 보유한 공공데이터 개발에 적극적이다. 이에 정부는 모든 공공 데이터를 민간이 활용할 수 있도록 개방함으로써, 이를 활용해 자국 기업이 새로운 서비스를 만들고 사회 발전에 기여하도록 하고 있다.


미국 정부는 정보공개 사이트인 data.gov에 14개 분야에 19만 개의 데이터 셋을 개방하였으며, 영국 또한 data.gov.uk에 12개 분야의 약 40만 여개의 데이터셋을 다양한 현태로 제공하여 이를 활용한 수백여개의 어플리케이션을 등록하고 있다.


국내에서도 2013년 '정부3.0' 비전을 발표하고 정부가 가진 정보와 데이터를 국민에게 개방·공유하기 시작했다. '공공 데이터의 제공 및 이용활성화에 관한 법률(공공데이터법)'을 제정해 공공기관이 보유·관리하는 데이터 제공 및 그 이용 활성화에 관한 사항을 규정함으로써, 국민의 공공데이터에 대한 이용권을 보장하고, 공공데이터의 민간 활용을 통한 삶의 질 향상과 국민경제 발전을 촉진하고 있다.




[표1] 공공데이터 개방과 활용현황 - 출저 : 공공데이터포털(www.data.go.kr)



공공데이터법 시행 2년 만에 공공데이터포털의  개방 데이터는 21만건으로 2013년에 비해 4.1배 증가했으며, 우리나라는 최근 경제협력개발기구(OECD) 공공데이터 개방 지수(Open Useful Reusabl; OUR Index)에서 미국, 영국, 프랑스 등 주요 국가를 제치고 소속 국가 중 공공데이터 개방·활용을 가장 잘하는 나라로 평가 받았다.


그럼에도 공공데이터의 품질과 활용 측면에서는 미흡한 면을 보이고 있다. 공공데이터가 존재함에도 현행화가 미흡하거나, 제공형태 및 품질이 원하는 수준으로 제공되지 않으며, 공공데이터 활용에 가중한 가공 시간에 소유되는 등의 이유로 민간에서는 공공데이터 사용을 꺼리고 있는 실정이다.


공공기관 역시 상식적으로 품질관리를 위한 자체적인 품질관리지침 및 규정을 정의하고 품질관리 절차를 수립하고 준수하는 기관은 전체 대비 4.5%에 불과함으로써 민간에 공공데이터의 품질 및 관리 수준이 저조한 현황을 보이고 있다.


공공데이터의 주요 품질 오류 유형으로는 아래와 같다.

  1. 오류 데이터 값의 지속적인 유입

  2. 업무규칙 적용 미흡으로 인한 데이터 신뢰성 저하

  3. DB구조 설계·변화관리 미흡으로 인한 데이터 품질 저하

  4. 데이터 관리 활동 미흡으로 인한 데이터 품질 유지 곤란

  5. DB 관리 산출물 현행화 미흡으로 인한 데이터 품질 저하

  6. 원하는 데이터 검색 불가

  7. 테이블컬럼 중복으로 인한 데이터 중복, 불일치

  8. 데이터 이력관리 미흡으로 인한 데이터 신뢰성 검증 불가

  9. 연계 표준·기술 등으로 인한 연계데이터의 정합성 미비

행정안전부는 공공기관 자체적으로 품질관리를 수행할 수 있도록 객관적 품질관리 수준 측정 및 평가체계인 공공데이터 성숙도 모델을 개발하고, 공공데이터 수집·생성·운영·제공 등과 관련된 기관차원의 품질관리 활동 전반에 대한 평가를 통해, 공공데이터 생애 주기별 품질관리 체계를 마련하고자 노력하고 있다.


각 기관차원에서 데이터의 최신성, 정확성, 상호운용성이 확보되도록 효과적으로 공공데이터를 관리하여 고품질의 데이터를 제공할 수 있도록 정책 수립 및 정보생명주기를 고려한 계획, 구축, 운영, 활용의 단계별 품질관리 활동을 제시한다.




[그림2] 공공데이터 품질관리 단계별 활동



이를 바탕으로 '16년도에 국가중점데이터 11개 DB, 민간활용 우수DB 10개 등 총 21종의 DB에 대한 수준평가를 시행하였고 '17년에는 총 42개 DB에 대한 품질 수준평가를 시행중이다.


평가기준은 데이터 생애주기를 고려한 계획-구축-운영-활용의 4개 영역에 16개 평가항목으로 구성되어, 각 평가항목은 5단계로 평과결과를 제시함으로써 기관이 관리하는 공공데이터 품질상태를 진단하고 개선방향을 제시하여 공공데이터의 안정적 품질향상을 도모하고 있다.





[그림3] 공공데이터 품질관리 수준평가 영역



- 계획단계 : 품질관리를 위한 목표 및 실행계획읗 수립하는 단계로서 데이터 품질정책 수립, 데이터 품질조직 구성, 데이터 품질계획 수립, 품질관리 교육 및 지식공유 영역으로 구성


- 구축단계 : 사전 예방적 품질관리를 목적으로 표준이나 기준이 되는 데이터를 체계적·지속적으로 구축하는 단계로서 데이터 표준 정의, 데이터 표준 점검 및 조치, 데이터 구조 정의, 데이터 구조 점검 및 조치, 데이터 연계 정의, 데이터 연계 점검 및 조치로 구성


- 운영단계 : 품질을 진단 및 개선하기 위한 단계로서 정제대상을 정의하여 오류데이터 및 관련데이터를 수정하며, 오류데이터 발생의 근본 원인을 분석하여 개선방안을 마련하고 개선을 수행할 수 있도록 업무 규칙 정의, 데이터 품질 진단, 데이터 품질 개선 영역으로 구성


- 활용단계 : 품질오류 수집과 품질관리 성과평가를 통해 품질관리 목표에 반영하는 단계로서 개방데이터를 발굴, 제공, 갱신하는 프로세스들로 개방데이터의 오픈포멧, 개방데이터의 최신화, 개방데이터 활용 점검 및 조치 영역으로 구성


각 기관에서는 16개의 평가항목에서 제시하는 평가지표에 떠러 자체평가를 1차로 실시하고, 일정요건을 갖춘 평가팀이 현장방문을 통해 인터뷰, 중점확인 등 2차 평가를 실시함으로써 평가의 전문성과 객관성을 확보하고 있다.


공공데이터의 품질 수준은 품질 관리 성숙 수준에 따라서 1레벨(도입前)→ 2레벨(도입)→ 3레벨(관리화)→ 4레벨(체계회)→ 5레벨(최적화)의 5단계 등급 체계로 정의된다. 데이터 품질관리 프로세스의 인식이 미흡한 성숙수준을 '도입전'으로 정의하고, 기본적인 데이터 품질관리 활동을 수행하는 성숙수준을 '도입'이라 하며 이 수준부터 데이터 품질관리가 적용된다. 데이터 품질관리 체계가 존재하지만 이를 관리하는 활동들이 수행되는 성숙수준을 '관리화'라고 한다. 관리화를 넘어 전사적으로 적용과 계략적 성과측정이 가능한 성숙수준이 '체계화'이며, 체계화가 선순환 및 지속적으로 이루어지는 성숙수준을 '최적화'라고 한다.





[표2] 공공데이터 품질수준 평가등급



최근 공공데이터를 활용한 앱 개발 및 경진대회 들이 활발히 진행되면서 공공데이터에 대한 일반인들의 관심이 증가되고 있으며, 이를 활용하여 창업하는 사례도 증가하고 있다.


공공데이터전략위원회는 '17년 공공데이터 시행계획을'을 통해 4차 산업혁명을 시도할 지능·융합형 공공데이터 개방 확대하여, '인공지능(AI) 의료영상진단정보', 'IoT 기반 건축물 에너지 정보'등 중점 데이터를 개방한다. 기관이 보유한 공공데이터 중 민간 수요가 높고 새로운 부가가치를 창출 할 수 있는 분야·지역별 데이터로 '실시간 해양수질 정보'와 '지점·차로별 상세 교통소통 데이터'등도 개방함으로써 차세대 국가성장 동력으로 부각되고 있는 신산업분야의 성장을 공공데이터가 선도 지원할 수 있도록 새로운 데이터 산업 생태계를 위한 기반을 마련하고 있다.


이에 공공데이터의 데이터 생애주기별(생성-개방-유통-활용)로 품질관리 범위를 확대하여 국민과 기업에게 꼭 필요한 품질수준을 지속적으로 유지하여, 공공데이터의 민간활용도를 제고하고 공공데이터의 신뢰성을 확보함으로써 4차 산업혁명 시대의 진정한 데이터의 가치를 갖게 될 것이다.




[비투엔 공공데이터 품질 사업 참여 내역]


비투엔은 '10년 공공정보 품질제고를 위한 전문용역을 시작으로 공공데이터 품질지원단 운영 기술지원 용역사업'등 한국정보화진흥원 공공정보데이터 품질사업에 지속적으로 참여하여 주요 공공기관의 공공데이터의 품질을 개선하는 등 데이터 품질 사업과 개방체계 구축 사업에서 전문성을 인정 받고 있다.


  • '17년  공공데이터 품질관리 용역 사업 : 42개 DB에 대한 품질수준평가 등 개방데이터 품질점검 및 점검 기술 컨설팅 수행

  • '16년 공공데이터 품질지원단 운영사업 : 21개 DB에 대한 품질수준평가 등 개방데이터 품질점검 및 점검 기술 컨설팅 수행

  • '16년 공공데이터 품질관리 지원사업 : 국립농업과학원 개방데이터 품질진단 및 개선수립

  • '16년 보건복지부 사회보장정보 데이터 개방체계 구축사업 : 한국수자원공사 개방체계 구축

  • '15년 실시간 수도정보 데이터 개방체계 구축사업 : 사회보장정보시스템(행복e음) 구조진단 및 개선 수립

  • '15년 농축산경략 및 조사가격 정보개방체계 구축사업 : 농수축산경략 및 조사가격 정보개방체계 구축사업

  • '14년 공공DB 품질관리 지원 2차 사업 : 11개 기관 13개 DB 품질진단 및 개선

  • '13년 공공 DB 품질관리 지원 1차 사업 : 9개 기관 9개 DB 품질진단 및 개선