[기고] 스마트하지 않은 데이터 허브 구별법
데이터 허브가 다른 플랫폼과 어떤 차이가 있는지 지자체 담당자분들에게 많은 문의를 받아왔다. ‘빅데이터 플랫폼’, ‘통합 플랫폼’, ‘데이터 댐’ 등 구별이 힘들 정도로 다양해 혼란스러운 것이 당연하다. 또 이미 도입했다면 어떻게 활용하고 정리할지 고민될 수밖에 없다. 그리고 다른 지자체와 비교할 때 올바른 방향으로 가고 있는지도 항상 궁금할 것이다.
결론부터 말하자면 ‘데이터 허브’를 중심으로 각각의 기능을 정리하면 30%이상 비용을 줄일 수 있고, 다른 지자체보다 돋보이는 스마트시티 플랫폼을 만들 수 있다.
왜 데이터 허브가 중심일까? ‘스마트+폰’, ‘스마트+홈’, ‘스마트+시티’ 등 앞으로 우리가 마주할 세상은 더 스마트해질 것이 분명하다. 그리고 스마트시티 기술에서 데이터 허브의 올바른 선택이 무엇보다 중요하다.
데이터 허브는 스마트시티의 두뇌와 같다. 도시에서 발생하는 다양한 수집 데이터를 분석해 도시문제 해결을 위해 적절한 판단을 내리는 역할을 한다. 똑똑한 데이터 허브를 구축한다는 것은 도시에서 발생하는 에너지, 교통, 안전 등 여러 분야에서 발생하는 문제를 발 빠르게 해결할 수 있다는 의미다.
스마트시티 사업에서 데이터 허브가 중요하다는 사실은 이제 누구도 부정할 수 없다. 그러한 이유로 많은 지자체에서 데이터 허브 센터(또는 빅데이터 센터)를 구축하려는 다양한 노력을 하고 있다. 하지만 대체 어디서부터 어떻게 만들어야 할지 고민이 이만저만이 아니다. 과연 어떤 기능이 중요한지 판단하기 쉽지 않기 때문이다.
우리는 도시에 복잡한 문제를 찾아내고 알맞은 솔루션을 제공하기 위해 스마트한 데이터 허브를 선택해야 한다. 다년간 스마트시티 사업과 지자체를 경험하면서 도시문제 해결을 위해 데이터 허브에서 꼭 빠져서는 안 될 중요한 특징으로 ‘표준’과 ‘품질’, ‘분석(융복합)’의 세 가지를 확인할 수 있었다.
표준화된 방식으로 데이터 교환이 가능한가?
스마트시티 데이터 허브의 특징은 사기업에 비해 도시 간 데이터 연결이 유기적이라는 것이다. 이것은 표준화된 형태의 ‘데이터 교환’ 기능이 있어야만 가능한 일이다. 사기업은 데이터의 보안 및 개인정보 이슈로 외부로의 데이터 이동이 제한적이다. 하지만 공공기관은 데이터의 익명성만 보장되면 기본적으로 개방이 원칙이다. 이런 이유로 스마트시티에서는 인근 도시 간의 데이터를 자유롭게 교환하면서 유기적으로 의사결정을 내려야 한다.
한국전자기술연구원에 따르면 스마트시티 데이터 허브의 핵심 역할은 각 도시에서 발생하는 데이터를 연결하는 것이며, 이는 효율성은 물론 시민의 삶의 질을 높이는 방법이라 말한다. <그림 1>처럼 데이터 허브는 도시 간에 데이터가 혈관처럼 원활히 순환해야 가치가 높아진다. 비유하자면 마치 동일한 혈액형만 수혈이 가능하듯 데이터도 표준화된 형태이어야만 자유로운 교환이 가능하다.
해외 사례에서도 데이터 연결의 중요성이 나타난다. 덴마크는 탄소 배출을 줄이기 위해 열과 전력 생산을 결합하고 재생 에너지의 소비 데이터를 연결했다. 이러한 도시 간의 공동 작업으로 전체 석탄 사용량을 줄이고 재생 자원을 사용할 수 있는 체계를 만들었다. 이처럼 국가적으로 탄소 배출을 줄일 수 있었던 이유는 ‘데이터 연결’에 있다.
그렇다면 데이터 교환을 위해서는 어떤 표준 기술을 적용해야 할까? 단순히 legacy system에서 수집된 원천 데이터만을 위한 기존 표준을 선택할 수는 없다. 왜냐하면 도시에서 발생하는 데이터는 IoT, 센서 등 반정형, 비정형 데이터의 비중이 더 크기 때문이다. 결국 우리가 선택해야 할 데이터 교환 기술은 단순히 정형 데이터만이 아닌 모든 다른 데이터 형태를 포함한 정보 전달의 표준이어야한다.
NGSI-LD는 표준 인터페이스 교환 방식으로 국내뿐만 아니라 해외 다양한 도시의 데이터 허브 플랫폼과의 호환성을 지원한다. 다양한 형태의 데이터를 지원하고 국내외 도시 간의 상호연결이 가능한 표준 교환방식을 적용했는지가 스마트한 데이터 허브를 구별하는 첫 번째 조건이다.
고품질의 데이터를 유지할 수 있는가?
데이터 허브를 효과적으로 활용하기 위해서는 데이터 품질이 중요하다. ‘가비지 인, 가비지 아웃(Garbage in, garbage out)’이라는 말처럼 데이터를 분석할 때 좋지 않은 데이터가 입력되면 그 결과 값의 정확성도 떨어진다.
그럼에도 불구하고 스마트시티 데이터 허브의 데이터 품질은 그 중요성이 부각되지 않아 안타깝다. 많은 스마트시티 플랫폼들이 데이터 품질관리 기능이 누락돼 있거나 애플리케이션 단위의 최소 제어만 하는 형태로 구축돼 있다.
국내 공공데이터의 경우 정부가 법 제22조(공공데이터 품질관리)에 따라 적정한 품질수준의 확보와 제공 촉진을 위한 품질진단 및 평가를 추진하도록 하고 있다. 그리고 <표>와 같이 2018년도 45개 기관으로 시작해 2022년 687개 기관으로 품질평가를 확대 시행하고 있다. 이런 노력의 결과로 공공데이터 개방 측면에서는 데이터 품질 개선이 정착되고 있다.
시장조사기관 Gartner에 의하면 미국에서는 데이터 품질 도구에 기업당 연간 20만 달러(약 2.5억원)를 지출한다. 그리고 데이터 품질 개선에 매년 8만 달러를 지불한다. 비즈니스 의사결정을 위해 데이터 품질이 더욱 중요해지고 있음을 이미 시장은 알고 있는 것이다. 잘못된 의사결정으로 시민들의 안전과 편익의 기회가 사라져버려서는 안 된다. 비용이 들더라도 품질개선을 하는 편이 더 좋은 선택일 것이다.
본질적으로 데이터 허브는 RDBMS, NoSQL 등 다양한 데이터베이스(DB)에서 데이터를 수집한다. 그리고 IoT나 센터 데이터는 기계에서 발생하기 때문에 데이터 허브로 유입된 이후에 품질관리가 반드시 필요하다.
데이터 허브의 빅데이터 품질을 상시 점검하고 개선해 고품질의 분석 데이터를 유지하는 것이 중요하다. 일반 DB가 아닌 빅데이터의 품질 측정이 가능한 ‘SDQ for Bigdata’와 같은 솔루션이 필요한 이유다. 이렇듯 정확한 정보 제공을 위한 데이터 품질관리는 스마트한 데이터 허브의 두 번째 중요한 조건이 된다.
융복합 분석 가능한 구조인가?
융복합 분석(Cross-domain Analysis) 서비스를 개별 지자체 단위가 아니라 전국적으로 제공하기 위해서는 분석 알고리즘의 표준 구조가 마련돼야 한다. 사업 초기에 “스마트시티의 융복합 분석은 무슨 차별점이 있나요?”라는 질문을 가장 많이 받았다.
스마트시티에서는 ‘도시 간 데이터의 공유와 연결’이 핵심이다. 스마트시티의 융복합 분석은 도시의 각 개별 서비스와 결합이 쉬워야 한다. 그리고 더 나아가 특정 도시의 모범사례를 다른 도시로 ‘서비스 적용’이 가능해야 한다. 이러한 조건을 만족시키기 위해 시나리오(Scenario), 기능(Function), 알고리즘(Algorithm) 이라는 3단계 계층 구조를 만들었다.
하나의 시나리오에는 여러 개의 기능이 있을 수 있고, 이 기능들은 독립적으로 관리되기에 다른 시나리오에서 활용이 가능한 체계다. 예를 들어, ‘관광’ 시나리오의 ‘유동인구 예측’ 기능을 만들었다면 그 기능을 ‘교통’ 시나리오에서도 사용할 수 있다. 더 나아가 타 도시의 시나리오에도 활용할 수 있다는 점에서 ‘서비스 적용’이 쉽다고 할 수 있다. 이러한 3단계 계층 구조는 알고리즘 모듈화를 통해 구현할 수 있다.
대구 데이터 허브 시연, 안전2.0 워크숍 행사에서 타 도시의 실무자들이 다수 참석해 “이런 화면이 우리 도시에도 있는데 어떤 방법으로 구현했나요?” 등의 의견을 물은 바 있다. 특정 도시에서 발생하는 문제들은 다른 도시에도 일어날 개연성이 아주 높다. 그래서 재활용성이 높은 분석 알고리즘의 표준 구조가 중요한 이유다. 동일한 도시 문제에 대해 타 도시에서 손쉽게 활용할 수 있도록 알고리즘 구조가 설계됐는지의 여부가 스마트한 데이터 허브의 세 번째 조건이다.
지금까지 데이터 허브에 꼭 있어야 할 세 가지 기능들에 대해 알아봤다. 결론은 표준 교환방식을 사용하고, 고품질의 데이터를 유지하며, 분석 알고리즘의 적용이 용이한 데이터 허브가 스마트하다고 할 수 있다. 이를 통해 데이터 허브를 어떤 기준에서 구축해야 할지 가늠할 수 있을 것이다. 데이터만 모아서 보관하면 어떻게든 될 것이라고 생각했던 과거와 달리 스마트하지 않은 것들을 골라내고, 우리에게 실질적으로 도움을 주는 데이터 허브를 구축해야 한다.
스마트시티는 인구의 도시 집중으로 인해 발생하는 복잡한 도시문제 해결의 대안이자 국가의 신성장동력으로 인식돼 왔다. 하지만 우리나라의 경우 스마트시티의 기술과 인프라는 어떤 나라에도 뒤지지 않지만, 데이터의 공유 및 활용, 도시의 융복합 서비스 등은 상대적으로 취약하다. 다음에는 이런 약한 분야까지도 성장시킬 수 있도록 ‘스마트하지 않는 데이터를 활용하는 방법’, ‘스마트하지 않는 생활을 바꾸는 융복합 서비스’에 대해 알아보도록 하겠다.
▶ 관련 기사 : 데이터넷 등