비투엔 기술기고 87

[기고] "빅데이터 플랫폼 활용 장애물을 뛰어넘는 전략 수립 필요"

많은 기업들이 점점 다양해지는 데이터를 효과적으로 활용하기 위해 빅데이터 분석 플랫폼을 구축하고 있다. 기업이 보유하고 있는 데이터를 Data Lake라는 PooL 안에 담아두려는 인프라 확보를 시작으로, 다양한 형태의 데이터를 수집하고 고도화된 분석을 통한 양질의 인사이트를 의사 결정자에게 제공하기 위한 노력을 기울이고 있다. 하지만 여전히 수많은 기업/기관들은 구축해 놓은 데이터 플랫폼에 대해 회의적인 시각을 갖거나 빅데이터 분석 플랫폼을 운용하는 데 있어서 많은 어려움에 직면해 있는 것이 현실이다. 예를 들면, 구축해 놓은 데이터 플랫폼의 투자 수익성에 대한 의구심, 기 운용 중인 정보계/분석계 시스템과의 차별성, 빅데이터 자원 및 데이터 플랫폼에 대한 활용 증대 방안 등과 같은 여러 현실적인 고민..

[기고]“글로벌 4차 산업 경쟁, 공공데이터 품질이 좌우한다”

OECD 공공데이터 지수(OURdata Index)는 국제 공공데이터 헌장(IODC)에 기초해 OECD 조사 대상국의 공공데이터 정책 평가를 위해 개발된 지수로 2년마다 측정된다. 공공데이터 관련 정부의 노력을 ‘데이터 가용성(Data Availability)’, ‘데이터 접근성(Data Accessibility)’ 및 ‘데이터 활용을 위한 정부 지원(Government support for data re-use)’의 세 가지 분야로 평가한다. 행정안전부에서 운영하는 공공데이터 포털에는 파일 데이터, 오픈 API, 표준 데이터 셋 등을 포함해 약 7만7000여건 이상의 데이터를 공개하고 있다. 이는 각 공공기관이 생성한 데이터를 개방한 것으로, 개별 기관이 별도로 공개하는 자료도 있으니 공개된 공공데이터..

[기고] 스마트하지 않은 생활을 바꾸는 융복합 서비스

| 데이터 허브 핵심 ‘융복합 서비스’…시민 참여 어우러져야 좋은 융복합 서비스는 어떻게 만들어지는가? 융복합 서비스는 서로 다른 영역의 데이터를 융합해 만든 AI 알고리즘(머신러닝, 딥러닝) 서비스를 말한다. 그런데 지자체 담당자들과 AI 알고리즘에 대해 이야기하다 보면 AI 알고리즘을 적용하면 뭐든 다 할 수 있는 것이라는 오해가 있다. 물론 미래에는 가능할 것으로 예상되지만, 우리는 현재에 집중할 필요가 있다. 필요에 맞는 기능 디자인 지난 글인 ‘스마트하지 않은 데이터를 활용하는 방법’에서도 언급했듯이 데이터는 항상 완벽하게 준비되지 않는다. 융복합 서비스를 잘 만들기 위해 가장 먼저 생각할 부분은 확보한 데이터의 특성을 이용해 서비스 아이디어를 내는 것이고, 다음은 시민들의 필요에 맞는 기능들을..

[기고] 스마트하지 않은 데이터 활용법

어쩌면 여러분은 스마트하지 않는 데이터까지 활용해야 할 필요성을 전혀 느끼지 못할 수도 있다. 스마트시티 사업은 최신 기술을 이용해 눈길을 끄는 것이 중요하다고 생각되기 때문이다. 스마트시티 업계 종사자들은 수차례 전시행사를 진행하면서 참관객들이 ‘디지털 트윈’과 같은 3D 시각화를 선보인 부스에 환호했다는 것을 이미 알고 있다. 시각화 기술이 중요하다는 의견에 필자 역시 동의하지만, 그 이상으로 데이터를 스마트하게 하는 과정이 중요하다. 여전히 데이터를 스마트하게 활용한다는 점이 와닿지 않을 수 있다. 예를 들어 겉보기에는 화려하지만 입으로는 거짓말을 하는 사람이 있다고 가정해보자. 잠깐 바라보는 것은 좋으나 시간이 지날수록 그 매력은 떨어지기 마련이다. 이렇듯 데이터는 우리가 말하는 것처럼 일종의 의..

[기고] 스마트하지 않은 데이터 허브 구별법

데이터 허브가 다른 플랫폼과 어떤 차이가 있는지 지자체 담당자분들에게 많은 문의를 받아왔다. ‘빅데이터 플랫폼’, ‘통합 플랫폼’, ‘데이터 댐’ 등 구별이 힘들 정도로 다양해 혼란스러운 것이 당연하다. 또 이미 도입했다면 어떻게 활용하고 정리할지 고민될 수밖에 없다. 그리고 다른 지자체와 비교할 때 올바른 방향으로 가고 있는지도 항상 궁금할 것이다. 결론부터 말하자면 ‘데이터 허브’를 중심으로 각각의 기능을 정리하면 30%이상 비용을 줄일 수 있고, 다른 지자체보다 돋보이는 스마트시티 플랫폼을 만들 수 있다. 왜 데이터 허브가 중심일까? ‘스마트+폰’, ‘스마트+홈’, ‘스마트+시티’ 등 앞으로 우리가 마주할 세상은 더 스마트해질 것이 분명하다. 그리고 스마트시티 기술에서 데이터 허브의 올바른 선택이 ..

[기고] 모던 데이터 거버넌스(Modern Data Governance)

정동원 비투엔 거버넌스전략팀 이사 인류는 고대부터 오늘날까지 정보의 중요성을 본능적으로 인지해 왔으며 기록을 통하여 다음 세대에 데이터를 전달하려 노력해왔다. 과거 기록의 대표적인 예로는 동굴 벽화, 종교의 교리, 국가 운영 기록(조선왕조실록) 등이 있다. 과거 데이터 기록은 매체 또는 기록 능력의 한계로 인하여 극소수의 누군가를 통하여 이루어졌다는 점을 특징으로 한다. 그러나 매체와 개인 기록 능력이 보편화된 이후 인류 데이터 기록(데이터)은 기하급수적으로 늘어났으며, 특히 문자의 발달, 인쇄술의 발달, 전자기록매체 발달, 통신기술의 발달로 인하여 기록의 양은 더욱더 확대되어 오늘날은 하루에 1,616억GB(10의 9승 바이트)가 생성/복사/소비되고 있다. 이렇듯 데이터는 우리의 생활에서 가장 가깝고 ..

[칼럼] 우리 데이터 산업의 미래를 위해 중소기업 역량 내재화와 경영자의 기를 살려야

| 조광원 (주)비투엔 대표이사/(사)한국데이터산업협회 명예회장 향후 우리의 미래 산업인 자율주행, 메타버스 등 인공지능 서비스에 필요한 핵심 원자재는 세상을 빠르고 정확히 예측하고 이해할 수 있게 하는 다양하고 방대한 양질의 데이터이다. 2018년 8.31에 문재인 대통령이 데이터 경제를 선언하며 추진된 데이터 고속도로와 데이터 댐 구축 사업은 코로나19의 팬데믹 위기 극복을 위한 정부의 미래형 산업화를 위한 디지털 뉴딜 정책의 핵심 산업이다. 이러한 디지털 뉴딜을 견인하는 주역은 바로 데이터 산업인력이다. 안전하고 정확한 인공지능 서비스까지 가능하게 할 수 있는 양질의 고품질 데이터 댐을 구축하고 효과적으로 잘 활용하기 위해서 가장 필수는 바로 “사람” 즉, “인재양성”이라고 산업계뿐만 아니라 학계 ..

[기고] 빅데이터 세상을 여는 KEY, 융복합 분석

[기고] 빅데이터 세상을 여는 KEY, 융복합 분석 융복합 분석 개념 데이터 분석의 트렌드가 개별 업무 영역 단위의 문제 해결로 제한되기보다는 다양하고 복잡한 세상의 관점에서 문제를 해석하는 융복합 분석 방식으로 변화하고 있다. 특히 도시는 급격한 발전으로 인해 각종 범죄, 교통혼잡 등 그동안 경험하지 못했던 문제들에 직면하고 있다. 필자가 이번에 다루고자 하는 융복합 분석의 개념은 복합적인 도시 문제 해결을 위해 설계된 새로운 분석 개념으로써, 이종(異種) 데이터의 융복합을 통해 처리한 통계정보 및 학습된 머신러닝 알고리즘을 말한다. 융복합 분석은 스마트시티 사업의 핵심 기술로서, 융합된 데이터를 분석에 활용해 도시에서 발생하는 문제를 해결할 수 있는 서비스를 도출하는 것이 목적이다. 이런 융복합 분석..

[시론] 국가 재난안전 데이터 거버넌스 추진 방향

| 조 광 원 (주)비투엔 대표이사/(사)한국데이터산업협회 명예회장 들어가는 말 2020년부터 현재까지 우리는 코로나바이러스감염증-19(COVID-19)로 인해 변화된 삶을 살아가고 있다. 불과 2년 전까지만 해도 마스크를 항상 착용하면서 생활한다거나 오프라인 단체 모임이 제한되는 지금의 상황을 상상하기란 쉽지 않았을 것이다. 이러한 상황을 겪으면서 자연재난 앞에서 인류가 얼마나 나약하고 무기력한 존재인지 다시 한번 깨닫게 된다. 현재 우리나라뿐만 아니라 대부분의 국가에서 활용할 수 있는 자원과 역량을 총동원해 코로나바이러스 감염증-19와 사투를 벌이고 있지만, 이 싸움이 어떻게 끝날지는 아무도 예상조차 할 수 없는 상황이다. 최근 세계 여러 곳에서 집중호우와 홍수 그리고 폭염 등 역대급 기후 재앙으로 ..

[솔루션] 비투엔 ‘SDQ for AI’, AI 학습용 데이터 품질 관리 시장 주도

‘어노테이션 자동 진단 시스템 기술 특허’ 기반 고품질 학습용 데이터 확보 음성·자연어, 비전, 자율주행 등 다양한 분야 학습용 데이터 품질 검사 완벽 지원 [데이터넷] 인공지능(AI)의 발전과 함께 딥러닝 활용에 필수적인 학습데이터 구축의 중요성이 높아지고 있다. 이에 비투엔(대표 조광원)은 양질의 데이터셋 구축을 위한 고품질 학습용 데이터 확보와 라벨링 정확도 향성을 위해 AI 학습용 데이터 품질 관리 솔루션 ‘SDQ for AI’를 선보이고, 황무지였던 AI 학습용 데이터 품질 관리 시장 개척에 나서고 있다. 글로벌 AI 시장의 폭발적 성장에 따라 데이터 전처리 분야는 2025년에 8.6조원으로, 품질 검증 분야는 5200억원 이상으로 성장할 것으로 전망되고 있다. 정부는 우리나라가 이러한 글로벌 ..