[기고] 모던 데이터 거버넌스(Modern Data Governance)
정동원 비투엔 거버넌스전략팀 이사
인류는 고대부터 오늘날까지 정보의 중요성을 본능적으로 인지해 왔으며 기록을 통하여 다음 세대에 데이터를 전달하려 노력해왔다. 과거 기록의 대표적인 예로는 동굴 벽화, 종교의 교리, 국가 운영 기록(조선왕조실록) 등이 있다. 과거 데이터 기록은 매체 또는 기록 능력의 한계로 인하여 극소수의 누군가를 통하여 이루어졌다는 점을 특징으로 한다. 그러나 매체와 개인 기록 능력이 보편화된 이후 인류 데이터 기록(데이터)은 기하급수적으로 늘어났으며, 특히 문자의 발달, 인쇄술의 발달, 전자기록매체 발달, 통신기술의 발달로 인하여 기록의 양은 더욱더 확대되어 오늘날은 하루에 1,616억GB(10의 9승 바이트)가 생성/복사/소비되고 있다. 이렇듯 데이터는 우리의 생활에서 가장 가깝고 중요한 존재가 되어버렸다. 이에 따라 조직에서도 데이터 중요성이 더욱 부각되고 있으며, 최근에는 데이터를 활용하여 새로운 가치를 찾고자 하는 노력이 매우 활발하게 일어나고 있다. 그러나 아쉽게도 데이터 활용을 위한 노력 대비 그 성과는 매우 미흡한 상황이다. 많은 전문가들은 인프라 중심의 활용 추진, Data 품질 이슈, Data Scientist의 역량 이슈 등 다양한 원인을 이야기 하고 있다.
이러한 문제의 원인에 보다 본질적으로 접근하기 위해서는 데이터 분석 업무를 담당하는 Data Scientist들의 문제제기에 귀를 기울일 필요가 있다. 다수의 Data Scientist들에 따르면 유의미한 데이터 분석 결과를 방해하는 원인을 크게 3가지로 들고 있다.
하나, 분석 가능한 데이터가 충분하지 않다. 대부분의 업무가 정보화 되어 있고 데이터 저장을 위하여 상당한 비용을 지출하고 있는데도 데이터가 충분하지 않다니 의아할 지도 모른다. 그러나 우리가 여기서 주목해야 하는 부분은 ‘분석 가능한’이라는 부분이다. 데이터는 많은데 분석 가능한 데이터가 없다면 그 이유는 데이터 생성 및 저장 시 추후 분석을 고려하지 않았기 때문이다.
둘, 데이터 전처리를 위하여 소요되는 시간적 비중이 과도하다. 이 원인은 앞서 든 첫 번째 원인에서 기인한다. 분석 가능한 데이터가 충분하지 않기 때문에 분석 가능한 데이터로 만들기 위하여 전처리에 많은 노력을 기울이고 있기 때문이다.
셋, 활용하고자 하는 데이터의 소재 정보와 속성 정보가 충분하게 제공되지 않는다. Data Scientist들은 데이터 분석에 활용하고자 하는 데이터의 저장 위치와 데이터의 특성, 구조, 비즈니스적 의미 등의 내용이 포함된 속성 정보가 제공된다면 데이터 분석활동이 보다 효과적일 것이라 말한다.
Data Scientist들이 말하는 이러한 원인을 해결하기 위하여 Data Governance체계를 도입 및 운영하는 조직이 늘어나고 있다. 그러나 안타깝게도 데이터 분석 활성화 수준이 Data Governance를 운영하기 이전보다 드라마틱하게 개선되지 못하고 있다. Data Governance를 도입하면 데이터 분석 활동이 보다 활성화될 수 있을 것이라 예상하였으나, 기대만큼은 미치지 못하고 있는 상황이다. 그렇다면 과연 Data Governance는 데이터 분석 활성화를 위한 마중물 역할을 할 수 없는 것인가? 이러한 의문을 해결하기 위하여 Data Governance 본질에 대한 고찰이 필요하다.
우선 Governance라는 단어가 갖는 사전적 의미를 살펴보자. 존 피에르(Jon Pierre)와 피터스(B. Guy Peters)는 “정책 결정에 있어 정부 주도의 통제와 관리에서 벗어나 다양한 이해당사자가 주체적인 행위자로 협의와 합의 과정을 통하여 정책을 결정하고 집행해 나가는 사회적 통치 시스템”을 Governance로 정의했다. 그렇다면 현재의 Data Governance는 Governance라는 단어가 갖는 의미를 충분히 구현하고 있는가? 아쉽게도 오늘날의 Data Governance에서는 관리 및 통제가 우선시되고 있다. 이는 과거의 데이터관리체계의 연장선에서 Data Governance를 구상했기 때문이다. 일부 전문가들은 데이터 표준/구조/품질을 중심으로 Data Governance를 정의하기도 한다. 물론 Data Governance를 추진하는 조직의 환경에 따라 표준/구조/품질을 중심을 Data Governance를 추진할 수도 있다. 그러나 데이터 분석 활성화를 목표로 하는 조직이 데이터 표준/구조/품질을 중심으로 Data Governance를 추진하는 것은 적절하지 않을 가능성이 높다.
[그림1 : Traditional Data Governance Framework, 출처 : 한국데이터베이스진흥원]
그렇다면 Data Governance를 어떻게 진화시켜야할 것인가?
우선 Governance가 갖는 고유한 의미를 상속하여 Data Governance의 관점을 서비스 및 분석 중심, 사용자 중심으로 전환하는 것이 필요하다. 또한 Agile 방법론 기반의 프로젝트 수행을 고해야 하며, 최신의 Data Architecture 및 Technology 적용과 운영에 대한 내용이 포함되어야 한다. 그리고 체계적 데이터 관리 및 데이터 분석 활성화에 관한 조직문화에 대한 내용도 포함되는 것이 바람직하다. 최근에는 이러한 관점이 적용된 Data Governance를 Modern Data Governance로 정의하고 있다. Microsoft에서는 “Data가 모든 용도에 맞게 최적화되어 조직 및 기능에 걸쳐 더 깊은 통찰력을 제공하도록 하는 것”, Gartner에서는 “조직의 비즈니스 경쟁력 강화를 위한 강력한 도구”로 Modern Data Governance를 정의하고 있다. Eckerson Group*은 위에서 언급한 Modern Data Governance 개념이 적용된 Framework을 아래와 같이 제시한다. Framework의 Layer는 목적(Goals), 방법론(Methods), 이해관계자(People), 프로세스(Process), 기술(Technology), 문화(Culture)로 구성된다. 목적(Goals) Layer에서는 해당 조직에서 적용하고자 하는 Data Governance 구성요소를 정의하고, 하위 Layer에서는 목적(Goals) Layer에서 정의한 구성요소와 관련된 내용을 중심으로 Modern Data Governance를 정의한다.
* Eckerson Group : 미국 동부(보스톤)에 본사를 둔 글로벌 데이터 컨설팅 기업으로, 데이터 전략, 데이터 아키텍처, 데이터 관리, 데이터 거버넌스, 데이터 분석 컨설팅 서비스를 제공함
[그림2 : Modern Data Governance Framework, Eckerson Group]
물론 Modern Data Governance의 개념을 적용하여 Data Governance를 추진한다고 해서 반드시 목적을 달성한다는 보장은 없다. 그러나 기존의 Data Governance를 맹목적으로 도입하는 것 대비 성공 가능성은 증가시킬 수 있다. 이에 ㈜비투엔에서 추진한 최근 사례를 바탕으로 Modern Data Governance의 성공적 추진을 위한 방향을 아래와 같이 제시한다.
Framework 최적화 : Data Governance를 도입하고자 하는 조직의 상당수가 기존 Data Governance Framework을 그대로 적용하려한다. 이는 내 몸의 사이즈는 고려하지 않은 채 모양만 보고 기성품 옷을 입는 것과 같다. 아무리 예쁜 옷이라도 입었을 때 편하지 않으면 옷장에 방치되고 마는 것처럼, 아무리 저명한 Framework이라도 개별 조직에 맞지 않는다면 정착되기가 어려울 것이다. 따라서 Modern Data Governance를 도입 시, 각 조직에 최적화된 Framework을 새롭게 설계하거나, 또는 기존의 Framework을 테일러링하는 단계가 반드시 필요하다. 해당 단계에서 조직의 환경 · 데이터 특성 · 목적 등을 고려하여 고유한 Data Governance 구성요소를 정의해야 한다.
장기적 관점의 접근 : Data Governance를 프로젝트 형태로 추진한 후에는 으레 즉각적인 효과를 기대한다. 물론 즉각적인 효과가 발생하는 부분이 존재하지만, Data Governance의 진정한 효과는 관련 컨텐츠가 충분히 축적되고, 조직 내부 문화로 정착이 이루어진 후 발생한다. 따라서 Modern Data Governance의 효과를 극대화하기 위해서는 중장기적인 관점의 목표와 계획을 수립하고 이에 대한 지속적인 관리가 필요하다.
조직 문화 개선 : Modern Data Governance가 조직에 안정적으로 정착되기 위해서는 조직문화 개선을 위한 활동이 반드시 요구된다. 해당 활동의 대표적인 예로 데이터 데이터거버넌스 협의체 구성 및 운영, 사내 데이터 분석전문가 양성을 위한 프로그램 운영, 데이터 분석 기반의 의사결정 및 데이터 분석 활동 장려 등이 있을 수 있다. 또한 조직 문화가 개선되기 위해서는 사용자가 데이터를 충분히 이해할 수 있는 환경과 관련 제도를 마련하는 것도 반드시 필요하다.