들어가며
데이터를 다루는 직업을 가진 사람들에게 가장 친숙하면서도 중요한 데이터는 고객 데이터이다. 어느 산업이건, 어떤 업무영역이건 고객 데이터 없이 굴러가는 데가 흔치 않고, 대부분 유사한 모양새로 관리되며, 심지어 핵심 데이터 항목은 거의 동일한 형태로 관리되기 때문이다.
이렇게 고만고만해 보이는 고객 데이터도 시대의 흐름에 따라, 그 중요도나 위상, 관리 측면의 주요 이슈가 조금씩 변화해 왔다.
그 옛날 2000년대 초반에 참여했던 시스템 통합 프로젝트에서는, 고객영역은 MASTER성 데이터가 많아 이행 프로그램이 단순하다며 참여 구성원 중 가장 막내인 나에게 맡겼었다.
그 당시에는 데이터 정제를 위한 과감한 의사결정도 가능했고, 관련 이해관계자도 많지 않았는데 이는 당시 해당 기업의 특징도 있겠지만, 고객 정보의 가치나 관련 이슈는 지금에 비하면 참 사소했던 시절이다.
최근에 참여했던 차세대구축 프로젝트에서 고객영역은, 프로젝트 시작부터 안정화 기간이 종료되던 그 날까지 단 하루도 수월하게 지나간 적이 없는 그야말로 가장 Hot했던 영역이었다. 개인정보 보호, 암호화, 통합고객 관리 및 타 시스템과의 연계 등 온갖 다양한 이슈와 고려사항이 매일매일 샘솟아 숨 돌릴 틈 없었고, 그래서 처음부터 업무이해도, 데이터 모델링 및 커뮤니케이션 능력 모두 최고인 베테랑 여럿이 함께 맡아 진행해야 했던 영역이었는데, 이는 아마 요즘 어느 구축 프로젝트나 마찬 가지일 것이다.
이렇게 말도 많고 탈도 많은 고객데이터이긴 하지만, 관리하는 정보 유형이나 형태가 크게 달라지진 않았었는데, 최근 들어 참여한 프로젝트에서는 조금 새로운 유형의 고객 정보를 만날 수 있었다.
보다 더 정확한 고객 프로 파일의 확보를 고민하고, 여러 시스템에 혼재하는 고객 정보를 통합하기 위해 리소스를 쏟아 부어왔건만, 이번에 나타난 녀석은 굳이 그간 관리하던 고객 정보와 철저히 분리하여 관리해야만 하는 특성을 가졌다. 바로 '비식별고객' 정보가 바로 그것이다.
비식별고객 정보란?
비식별고객 정보는 누구인지 특정하지 않은 어떤 개인을 서비스의 잠재고객으로 정의하고, 그가 보유한 휴대폰이나 태블릿 등 디바이스를 통해 수집된 다양한 행태 데이터의 분석을 통해 획득한 고객의 기본특성, 즉, 인구통계학적 특성, 지리적 특성, 행동 특성, 심리적 특성 정보를 관리한다.
전통적인 고객 데이터가 특정 개인으로 확인된 고객과의 계약과 거래, VOC 접수, 상품의 배송 등 고객 접점에서 발생한 데이터를 기반으로 하였다면, 비식별고객 정보는 거래와는 직접 관련이 없는, 서비스이용 패턴이나 디바이스 활용 패턴 등을 통해 고객의 일상생활을 분석하고 그 패턴 데이터를 결합하여 비식별고객의 특성을 파악하고, 고객의 정보를 직접 획득한 '속성'이 아닌 유추된 '특성'이나 '성향’으로 관리한다.
기왕 보유하고 있는 좀 더 확실한 데이터인 고객 데이터를 두고, 왜 굳이 비식별고객 정보를 수집하고, 분석하여 사용하려는 걸까.
왜 비식별고객 정보를 관리하는가?
서비스 과정에서 수집한 데이터의 활용은 개인정보 보호법에 따라, 처리목적에 따른 데이터의 수집범위, 활용범위 등이 제한적이다. 데이터의 수집과 분석도 문제지만, 분석된 데이터의 활용이나 제공에도 제약조건이 많다.
빅데이터 시대, 데이터의 수집, 활용, 및 유통에 제약이 많아 관련 산업발전에 영향이 많다는 '주장'에 따라, 기존 보유하고 있는 고객 정보를 개인정보 침해 없이 활용할 수 있는 방안으로, 2016년 6월 행정자치부에서는 "개인정보 비식별 조치 가이드라인"을 발표하였다. 가이드라인은 개인 식별 정보를 가명/익명/범주화 등의 조치로 특정 개인으로 확인 불가능하도록 처리하면, 개인 정보가 아닌 것으로 간주할 수 있으며, 이렇게 비식별化된 정보는 당사자의 동의 없이도 활용/유통할 수 있다는 내용을 담고 있다.
하지만, 이 가이드라인은 소비자를 대변하는 시민사회도, 실제 보유데이터에 비식별 조치를 수행하고 데이터를 활용해야 하는 기업도 만족 시키지 못하고 있어 논란이 끊이질 않고 있다. 즉, 아직은 그 가이드라인을 따랐다고 해서 법적 의무를 다했다고 인정받기 어려운 분위기라고 할 수 있다.
비식별 조치를 통해 현재는 특정 개인으로의 식별이 불가능하다고 판단되어 배포된 데이터가 백만 분석가가 모이면 식별될 수 있고, 현재는 불가능해도 분석기법의 더욱 발달한 몇 년 후에는 식별 가능해질 수 있는 우려가 있으므로 소비자 입장에서는 여전히 안심할 수 없다.
기업 입장에서는, 비식별 조치된 데이터는 활용 효용성이 너무 떨어져 가치가 없어지고, 정부의 가이드라인에 따라 비식별 조치한 데이터가 유통 이후 식별되었을 때의 리스크는 모두 기업에 전가하고 있다는 불만이다.
이러한 제약조건에서 완전히 벗어나기 위해 광고업계에서 활용하고 있는 것이, 비식별 디바이스 기준으로 관리하는 비식별고객 데이터이고, 이에 활용되는 것이 전통의 강자 Cookie 트래킹과 디바이스 OS가 제공하는 광고 식별자 정보이다.
비식별고객은 어떻게 식별하는가?
비식별고객은 개인이 아닌, 개인이 사용하는 디바이스를 기준으로 개체를 식별한다.
APPLE의 iOS나 GOOGLE의 Android OS에서는 모바일 디바이스에 대해 광고식별자(ADID/IDFA)를 부여하고 있다. 광고 식별자는 광고 및 마케팅에 활용하기 위해 디바이스별 고유하게 부여된 식별자이긴 하지만 사용자가 원하면 설정App을 통해 언제든 재설정(reset)할 수 있어, 기기별 식별번호로 부여되어 개인정보로 분류되는 Mac Address 나 IMEI와는 구별된다.
모바일 기기의 경우, 특정 OS가 범용적으로 사용되고 있어, 모바일 디바이스의 광고 식별자 기준으로 관리된 비식별 정보는 서로 다른 기업 간의 데이터 유통 및 결합도 가능하다. 특정 기업, 특정 서비스에서만 확보됨으로 인해 생기는 데이터의 한계를, 다른 기업이 보유한 데이터와의 결합으로 극복하고, 다양하게 확장할 수 있는 장점도 갖추고 있다.
인터넷 웹사이트에서는 쿠키ID 기준으로도 식별 가능한데, 같은 디바이스 내에서도 브라우저에 따라 서로 다른 쿠키로 인식하므로 분석에 왜곡이 발생할 수 있고, 웹 브라우저상의 활동만 CHECK 가능하므로 그 외 App 서비스관련 이용 Log나 각종 Sensing 데이터 등 디바이스 자체가 생산하는 데이터의 수집에는 한계가 있다.
마무리
비식별고객 정보는 광고업계에서 먼저 논의되기 시작한 개념이다. 개인정보 이슈를 피해, 디바이스에서 수집된 데이터 항목과 사용자의 행태(action) 데이터 분석만으로, 디바이스 사용자의 성별이나 연령대, 주요 관심사나 성향 등을 분석 하여 Targeting 광고에 활용하기 하기 위해 고안된 개념이다.
하지만 IOT시대를 맞아, 데이터 기반 마케팅에 대한 수요가 늘고 데이터의 수집∙활용에 있어 개인정보보호 제약조건에 대한 고민이 전 산업 영역으로 확대되고 있다. 따라서, 효과적인 마케팅 및 서비스 Offering 기반 정보로서의 비식별고객 정보도 곧, 다양한 기업에서 공통적으로 나타나는 일반적인 고객정보의 한 영역으로 자리매김할 것이라 예상된다.
마지막으로, 개인정보 보호 이슈에 자유로운 비식별고객 정보로 유지∙관리하기 위해 유의해야 할 사항을 덧붙인다.
- 식별되지 않은 개인에 대한, 범주화된 정보에 한정하여 관리
- 식별된 고객 정보와는 H/W적으로나, S/W적으로도 완전한 분리 관리 및 유통
(데이터 연결 및 공유 불가, 동일 DB 및 서버 내 관리 불가)
- 분석된 비식별고객의 ‘특성’이나 ‘성향’에 대한 지속적인 정제 및 정교화를 위한 관리체계 마련
'비투엔 기술기고' 카테고리의 다른 글
[기고] 데이터 분석 프로젝트를 준비하는 히치하이커를 위한 안내서 (0) | 2018.03.12 |
---|---|
[기고] 왜 파이썬(Python)인가? (1) | 2018.02.08 |
[기고] 클라우드에서 “엣지(Edge)”로 (0) | 2018.01.24 |
[기고] 사례로 보는 사물인터넷(IoT) 데이터 품질관리 (0) | 2017.11.27 |
[기고] 데이터 프로파일링의 이해 (0) | 2017.11.17 |