[인터뷰] “데이터 유통 구조 혁신할 세계 최초의 빅데이터 플랫폼 만든다”
데이터 유통 구조 혁신할 세계 최초의 빅데이터 플랫폼 만든다!
오성탁 한국정보화진흥원 지능데이터본부장
[컴퓨터월드] 데이터 기반의 혁신을 위해서는 무엇보다 먼저 양질의 데이터 확보가 필수다. 필요한 데이터를 확보하고 활용할 수 있는 역량은 이제 조직의 핵심 경쟁력으로 떠올랐다. 이에 따라 기업들은 데이터를 확보할 수 있는 방법들을 다각화하고 있지만, 아직 국내에서는 원활한 데이터 유통 생태계가 마련되지 않아 기업 외부에서의 데이터 확보에 어려움을 겪고 있다.
최근 정부에서는 산업계의 요구를 받아들여 데이터 유통 생태계를 마련할 수 있는 다양한 정책을 제시하고 있다. 이러한 시도의 일환으로 과학기술정보통신부(이하 과기정통부)와 한국정보화진흥원(이하 NIA)은 지난해부터 ‘빅데이터 플랫폼 및 센터 구축사업’을 추진하고 있다.
해당 사업에서 핵심적인 역할을 수행하고 있는 오성탁 NIA 지능데이터본부장을 만나 해당 사업의 추진 현황과 미래 청사진에 대해 들어봤다.
▲ 오성탁 NIA 지능데이터본부장
산업군별 10개 플랫폼 마련해 데이터 유통 구조 혁신
문재인 대통령은 지난 2018년 데이터 규제혁신 행사에 참석해, 국내 데이터 산업 활성화를 위해 1조 원의 예산을 투입하겠다고 밝힌 바 있다. 국내 다양한 산업 분야에 산재된 데이터들이 적재적소에 활용돼 가치를 창출하고, 서로 다른 데이터들을 융·복합해 새로운 비즈니스 모델과 서비스를 개발할 수 있는 혁신 생태계를 마련하겠다는 취지다.
지난해 과기정통부는 국내 데이터 활용률을 높이고 유통 생태계를 활성화시키기 위한 ‘빅데이터 플랫폼 및 센터 구축사업’을 추진했다. 해당 사업은 공공과 민간이 협업해 전 산업군에서 활용 가치가 높은 데이터를 선별하고 이를 공유할 수 있는 체계를 마련하기 위해 마련됐다. 분야별 10개의 빅데이터 플랫폼과 100개의 센터를 구축함으로써 양질의 데이터를 생산·유통하고 이를 바탕으로 혁신적인 데이터 기반 서비스들을 발굴하겠다는 취지다.
해당 사업에는 3년간 약 1,500억 원의 예산이 투입된다. 지난해 3월부터 사업 공모를 실시해 총 10개 분야에서 44개 과제를 접수했으며, 두 차례의 평가를 거쳐 최종적으로 10개 과제를 선정했다.
각각의 과제는 해당 분야에서 양질의 데이터를 보유하고 있는 기업들과 이를 활용해 구체적인 서비스를 구현할 수 있는 기술을 갖춘 기업들이 컨소시엄을 구성해 추진한다. 축적된 데이터들을 서로 연결된 10개 플랫폼으로 나누어 구축해 데이터 유통 생태계를 활성화하고, 서로 다른 분야의 데이터들을 융·복합한 새로운 비즈니스 모델을 창출할 수 있도록 돕는다.
가령 종합평가에서 가장 높은 점수를 획득한 문화·미디어 분야의 ‘문화체육관광 빅데이터 플랫폼’의 경우, 한국문화정보원을 중심으로 22개 기업·기관이 컨소시엄을 구성해 참여했다. 특히 공공과 민간에서 각각 5개의 센터를 구축해 양쪽의 데이터 공급과 수요를 모두 아우를 수 있도록 했다. 한국문화정보원은 먼저 전국의 다양한 공연이나 전시 등 문화활동에 대한 데이터들을 결합해 사용자에게 맞춤형 추천을 해주는 서비스를 개발한다. 1차 년도에는 공연과 전시에 한정되지만, 2차 년도부터는 도서와 체육 분야로도 서비스 범위를 넓혀갈 계획이다.
‘빅데이터 플랫폼 및 센터 구축사업’을 위해 과기정통부와 NIA는 사업이 진행되는 동안 ▲데이터 생산·구축·수집·분석·유통·활용 등을 위한 인프라 구축 ▲데이터 품질 확보 및 표준화 등 양질의 데이터 재생산 비용과 창업 지원 ▲데이터 도메인별 전문 교육 ▲데이터 활용을 위한 전문기술 지원 등의 구체적인 체계를 마련한다. 또한 향후 10개 플랫폼과 100개 센터가 자생적으로 국내 데이터 생태계의 핵심으로 기능할 수 있도록 홍보 등의 지원을 지속적으로 제공한다.
다음은 오성탁 한국정보화진흥원 지능데이터본부장과의 인터뷰를 일문일답 형식으로 정리한 것이다.
Q. 국내 데이터 생태계 활성화를 위한 NIA의 활동을 소개해달라.
국내에서 데이터 산업이 민간과 정부 양측에서 집중적인 관심을 받게 된 계기는 지난 2018년 8월에 있었던 문재인 대통령의 데이터 경제 선언이라고 생각한다. 그 이후 국내 데이터 산업계를 활성화시키기 위한 정부와 민간의 노력이 본격적으로 가속화되기 시작했기 때문이다.
NIA는 일찍부터 데이터의 중요성에 대해 인식하고 활용성을 높이기 위한 다양한 방법을 지원해왔다. 데이터 활용 및 유통을 촉진시키기 위한 방안을 연구·개발하거나 기존의 데이터 관련 정책들이 활성화되기 위한 기반을 마련하고 있다. 원 내부적으로는 기존에 존재하던 데이터 관련 업무를 한 개 부서로 집중시킴으로써 결집력을 높이고 시너지를 발휘할 수 있도록 체계를 개편했다. 특히 지난 12월, 문재인 대통령께서 AI 기반의 경제·사회 혁신을 주문한 만큼 NIA에서는 이것이 잘 준비 및 실행될 수 있도록 조직과 거버넌스를 개선하고 있다.
또한 최근에 ICT 기술이 특정 부처나 기관, 기업에 한정된 문제가 아닌 만큼, 보다 다양한 조직들과 함께 국내 ICT 기술이 총체적으로 향상될 수 있도록 노력하고 있다. 대부분의 기업 및 기관들은 ICT 기술 기반의 혁신을 위한 조직을 갖추고 있으며, NIA는 각 조직들이 ICT 관련 업무를 효율적으로 추진하고 때로는 협업할 수 있도록 중간다리 역할을 수행한다.
Q. 지난해 ‘빅데이터 플랫폼 및 센터 구축사업’의 추진 성과는?
사업 1년차인 지난해에는 약 740억 원의 예산을 투입해 10개 플랫폼과 100개 센터 구축을 추진했다. 교통, 의료, 통신, 문화 등 기존에 축적된 데이터가 많고 활용 가치가 높은 10개 분야를 선정했으며, 각 분야별로 1개 플랫폼과 10개 센터를 구축한다는 계획이다. 이러한 체계가 완성되면 기존에는 만들어지기 어려웠던 혁신적이고 편리한 서비스들이 다수 개발될 수 있을 것으로 예상한다.
예를 들어 유통·물류 분야의 컨소시움에는 신용카드사나 리테일 기업, 택배사, 우편회사 등이 포함돼 있다. 이들의 데이터와 서비스들을 결합한다면 소비자가 인터넷에서 원하는 물건을 찾아서 구입하고 배송이 완료되는 순간까지, 그 모든 과정을 효과적으로 추적할 수 있을 것이다. 각각 별개로 운영되고 상호간에 최소한의 정보만 공유되던 플랫폼들이 하나로 결합되면서 새로운 서비스 모델이 만들어질 수 있는 기반이 다져지게 된다.
각각의 플랫폼 별로 집중하는 분야는 전부 다르다. 초기에는 각자의 분야에서 서로 데이터를 공유하고 결합하는 업무가 많을 것으로 예상된다. 하지만 궁극적으로는 10개 플랫폼들이 서로 다른 플랫폼의 데이터를 소비하고 결합할 수 있을 것으로 기대한다.
Q. 사업 과정에서 인상 깊은 사건이 있다면?
사실 민간 기업 입장에서는 자기들이 생산하고 구축해온 데이터들을 일반에 공개할 이유가 없다. 데이터가 기업의 경쟁력을 결정하는 시대에 독자적인 데이터를 확보하고 있다는 것은 큰 힘이 되기 때문이다.
그러나 국내 산업 전반의 혁신을 고려해야 하는 정부 입장에서는 기업들이 꽁꽁 숨기고 있는 데이터들이 시장에 나와서 보다 다양한 분야에서 활용될 수 있도록 해야 한다. 최소한 기업들이 서로가 어떤 데이터들을 보유하고 있는지를 알아야 혁신적인 서비스 모델의 단초가 생기기 때문이다. 이는 장기적으로 각 기업들에게도 큰 이익으로 돌아갈 것이다. 당장은 자신들만이 보유한 데이터를 공개하는 것에 부담을 느낄 수도 있겠지만, 결과적으로 다른 기업들이 보유한 방대한 데이터와 접할 기회를 얻음으로써 새로운 기회를 창출할 수 있다.
지난해 초에 10개 플랫폼에 대한 공모를 진행할 때, 사업에 참여하고자 하는 기업들이 컨소시엄을 맺는 과정에서 깜짝 놀랐다고 한다. 컨소시엄에 참여한 기업들끼리 각자가 어떤 데이터들을 보유하고 있는지 공유할 수 있었기 때문이다. 이때부터 이미 참여 기업들끼리 “그 데이터를 너희가 가지고 있었냐, 당장 우리가 사겠다” 같은 얘기가 빈번히 논의되기 시작했으며, 벌써 기업들 간에 데이터 거래가 일어나기도 했다. 본격적인 플랫폼 구축사업에 들어가기 전부터 서로 가지고 있는 데이터의 종류를 파악한 것만으로도 바람직한 결과를 내기 시작했다는 것이다.
이러한 데이터 공유가 단발성으로 그치지 않기 위해서는 기업들이 보유한 데이터를 무상으로 제공하거나 적절한 가격에 판매할 수 있는 공통된 플랫폼이 필요하다. 그게 바로 이번 ‘빅데이터 플랫폼 및 센터 구축사업’의 목표다.
▲ 오성탁 NIA 지능데이터본부장은 “‘빅데이터 플랫폼 및 센터 구축사업’은 컨소시움 구축 단계부터 데이터 유통 생태계에 긍정적인 변화를 가져오고 있다”고 강조했다.
Q. 데이터 품질 관리를 위해서는 어떤 노력을 하고 있는지?
다양한 데이터를 공통된 플랫폼에서 결합한다고 하더라도 해당 데이터의 품질 자체가 낮다면 의미가 없다. 빅데이터 플랫폼을 아무리 잘 구축하고 접근성 높은 인터페이스를 구현한다고 하더라도, 거기서 양질의 데이터를 얻을 수 없다면 오래지 않아 사용자들의 발길이 끊기고 말 것이다.
그래서 이번 사업에서는 분야별로 10개 플랫폼과 100개 센터를 구분하고 있다. 각 센터에서 수집한 데이터들은 플랫폼으로 옮겨지는 과정에서 변환과 정제 과정을 거치게 된다. 가령 같은 플랫폼에 속한 A센터와 B센터에서는 플랫폼으로 데이터를 올릴 때 서로 같은 기준을 바탕으로 데이터를 변환함으로써 원활한 결합이 가능하도록 돼야 한다.
이를 위해 NIA는 국내 IT서비스 전문기업 비투엔과 함께 데이터 품질 제고 작업을 하고 있다. 데이터가 원활히 활용될 수 있도록 어떤 기준에 맞춰 구축할 것인지, 플랫폼에 등록된 데이터들이 일정 이상의 품질 수준을 갖추기 위해 어떻게 해야할 것인지, 서로 다른 데이터 간에 결합이 잘 되도록 하기 위해 어떤 코드를 가져갈 것인지 등을 함께 논의하는 중이다. 특히 플랫폼마다 데이터 품질이나 특징이 제각각이라 결합이 어려운 경우가 있는데, 비투엔에서는 자체 전문가 그룹을 통해 이러한 문제를 어떻게 효율적으로 해결할 수 있을지 컨설팅이나 가이드를 제공해주고 있다.
Q. 이번 사업에서 가장 힘들었던 부분은?
미국이나 중국, 일본 등에는 데이터 유통을 위한 플랫폼이 마련돼 있지만, 우리가 추진한 이번 사업과는 상당히 다르다. 미국의 경우 민간 기업들이 주도적으로 데이터 유통 플랫폼을 운영하고 있는데, 액시엄과 같은 데이터 브로커 기업들이 대표적이다. 이들은 정부의 개입 없이 자체적으로 데이터에 가격을 매기고 판매하는 플랫폼을 운영한다. 반대로 중국은 정부 차원에서 국유기업 형태로 데이터 거래 플랫폼을 운영하고 있는데, 거래소 내에서 자체적으로 데이터를 가공하는 것으로 알고 있다.
무엇보다도 힘들었던 것은 전 세계 어디에서도 이번 사업과 비슷한 사례를 찾아볼 수 없었다는 점이다. 정부가 주도적으로 모든 산업분야의 데이터를 결합한 플랫폼을 구축하는 것도 최초고, 이를 10개 분야로 구분해 효과적인 통합이 가능하도록 구성한 것도 최초다. 그렇기에 참조할 만한 사례가 없어 초기 구상에 어려움이 따랐다. 하지만 사업이 성공적으로 수행된다면 그 가치는 전례를 찾아볼 수 없을 만큼 클 것으로 예상한다.
요새 IT 분야의 트렌드는 단일한 플랫폼에 모든 데이터들을 다 몰아넣는 것이 아니다. 이는 시간도 오래 걸리고 원하는 데이터들을 찾기도 어려우며, 어떤 데이터들이 기존에 없던 가치를 발휘할 수 있을지 고려하기도 힘들다.
따라서 이번 사업에서는 10개로 나뉜 각각의 빅데이터 플랫폼, 즉 서브 플랫폼 형태로 각 산업별 특징을 살린 데이터들을 모으고 이를 논리적인 형태의 단일한 플랫폼으로 결합하는 구조를 취했다. 산업별 특징을 살린 데이터들이 1차적으로 시너지를 발생시키고, 이후 이들이 단일한 플랫폼에서 만나 재차 새로운 시너지를 발휘하는 형태다. 이렇게 단계적으로 시너지를 발휘하는 데이터들이 궁극적으로 전혀 이질적인 형태의 가치를 창출하게 될 때, 거기서 기존에 없던 새로운 서비스가 발생할 것으로 확신한다.
Q. 2020년에 추진할 2차년도 계획에 대해 설명해달라.
2020년에는 추가적인 구축을 하지는 않고, 지난해 구축한 플랫폼·센터들이 안정화될 수 있도록 운영 및 유지보수에 집중할 계획이다. 특히 플랫폼에서 본격적으로 데이터 유통 사례가 발생할 수 있도록 거래 기능을 강화하려고 한다.
또한 빅데이터 플랫폼에서 거래가 활성화되고 그 위에서 서비스들이 개발될 수 있도록 모범 서비스 사례를 개발할 계획이다. 또한 사용자들이 편리하게 접근할 수 있도록 중소기업이나 개발자들을 대상으로 교육사업도 전개하고, 필요하다면 프로모션이나 콘테스트도 진행하려고 한다.
장기적으로 플랫폼이 활성화되기 위해서는 지속적으로 사용자들이 몰려들고 시끌시끌한 분위기를 만들어나가야 한다. 정부가 추가적인 예산을 투입하거나 별도의 지원을 제공하지 않아도 사용자들이 스스로 비즈니스 기회를 포착해 플랫폼에 몰려들어야만 이번 사업이 성공했다고 할 수 있다.
3년 후 사업이 종료됐을 때에는 정부 지원 없이도 플랫폼이 자생적으로 유지돼야 한다. 그러기 위해서 어떤 노력과 서비스를 해야할지, 데이터 판매나 유통을 위해 어떤 기능을 개발해야할지, 이런 문제들에 대해 이번 사업에 참여한 컨소시엄들과 많은 대화를 나누고 있다.
Q. 데이터 3법의 국회 통과가 지연되고 있는데, 이번 사업에 악영향을 미칠 걱정은 없는지?
데이터 3법 통과가 지지부진하게 늦춰지고 있는 것은 사실이지만, 그것이 이번 사업의 성패에 치명적인 영향을 줄 것이라고 생각하지는 않는다. 2019년 초에 이번 사업을 시작할 때 데이터 3법 통과를 고려하지는 않았기 때문이다. 그때부터 우리는 현행 법 제도 안에서도 문제없이 기능할 수 있는 플랫폼 구축을 목표로 해왔다. 데이터 3법 통과가 불발되더라도 현재 시스템 상에서 데이터를 연결하고 유통하는 프로세스 자체에는 문제가 없다. 만약 향후 예측하지 못한 유통 상의 문제가 발생한다고 하더라도 규제 샌드박스 제도 등을 활용해 지원하려고 하고 있다.
다만 개인적으로는 조금 늦더라도 데이터 3법은 결국 통과되리라고 낙관적으로 보고 있다. 정부에서도 필요성을 느끼고 있고 산업계의 목소리도 크기 때문이다. 만약 데이터 3법이 빠르게 통과되면 빅데이터 플랫폼 활성화가 급물살을 탈 것이라고 예상한다. NIA와 플랫폼 주관기관들은 데이터 3법이 빠르게 통과돼서 이번 사업이 국내 데이터 생태계에 발빠른 혁신을 가져다주기를 바라고 있다.