비투엔 기술기고

[데이터분석] B2EN 조현기의 데이터 분석 이야기~ 1편

알 수 없는 사용자 2014. 8. 21. 10:28

 

B2EN 블로그 데이터 분석 이야기 I written by 조현기

 

 데이터 분석 이란 세계 ?

최근에 아마존에서 ‘주문 전 상품 배송 특허’를 취득했다고 합니다. 그런데 이 특허 제목이 흥미를 유발합니다. ‘주문 전 상품 배송’ 이라니요. 일반적인 상식이라면 주문을 하고 나면 배송이 이루어진다 인데 주문을 하기도 전에 배송을 한다 라고 하니 약간은 어리둥절하게 느껴집니다. 왜 아마존이 이런 어리둥절한 특허를 내놓은 걸까요?

 


 

 


 " Amazon Yesterday Shipping " 

http://www.youtube.com/watch?v=HA_gwzx39LQ&feature=youtu.be

 


조금 더 내용을 살펴보겠습니다. 이 특허의 세부내용은 소비자가 상품을 주문하기 전에 해당 소비자가 언제 어느 상품을 주문할 것인지를 미리 예측해 배송을 시작하겠다는 것입니다. 아마도 소비자와 가장 가까운 물류거점에 상품을 가져다 두게 되지 않을까 싶습니다. 이렇게 되면 여러분이 온라인마켓에서 주문 후 1~2일 후에 받아볼 수 있던 상품을 오후 4시에 주문하고 퇴근 후 집에서 배송된 물품을 확인할 수 있다는 것입니다. 획기적입니다. 만약 이런 서비스를 하는 온라인마켓이 국내에 있다면 상당한 시장점유율을 차지하게 될 것이라는 생각이 듭니다. 빠른 시간 내에 상품이 배달되어야 효용성이 있는 경우에는 더욱더 주효하겠지요. 물론 앞으로 그런 서비스를 개발하는데 시간도 걸리고, 적중률에 대한 숙제도 풀어나가야 하겠지요. 하지만 이러한 서비스가 실현된다면 다른 온라인 마켓들은 위협을 느낄 것이고 동일한 서비스를 개발해 내려고 머리를 싸매거나, 아마 그렇지 못하다면 문을 영영 닫게 될지도 모릅니다.


아마존은 고객들이 사이트를 방문하여 클릭하는 페이지 뷰, 관심상품, 주문과 관련된 패턴을 분석하고 이를 활용해 나가고 있는 듯 합니다. 어느 시즌에 어떤 상품을 사고, 언제 여행과 관련된 상품을 사는 지 등의 다양한 데이터를 오랫동안 축적하여, 특정 기간 대에 선물용 물품을 주문한다거나, 여행용품을 매년 특정시즌에 사는지를 분석하여 고객이 필요로 할 만한 시점에 적절한 상품을 추천할 수 도 있겠고 이런 패턴들을 분석하고 적중률을 높여나가는 최적화 작업을 지속적으로 해 나간다면 ‘주문 전 상품 배송’이라는 것도 불가능한 것은 아니다라는 생각이 듭니다. 이런 이야기가 회자되고 기업들이 보유한 내부 데이터를 분석하고 활용해 가겠다고 한다면 아마 멀지 않아 올 수 도 있겠지요. 여하튼 데이터분석이 급격하게 활용될 수도 있겠다는 생각을 해 보게 됩니다.


이 즈음에서 글 쓰는 이가 왜 이런 글을 써 내려가는지 약간의 설명을 풀어 놓고 지나가야 할 듯 합니다. 데이터베이스 모델링과 성능을 전문으로 하는 집단에 속해 있으면서, 틈틈이 데이터분석에 대해서 관심 가지고 접근중인 1인입니다. 통계는 비전공으로 최근에서야 조금씩 필요한 부분만 좌충우돌하면서 익혀가고 있습니다. 글은 학습과정 가운데 공감이 갈 만한 소재들로 이야기를 풀어나가 보고자 합니다. 이 글은 그런 시도중의 하나가 되겠습니다. 그래서 데이터 분석과 관련된 전문적인 지식에 관한 이야기보다는 일반적이고 상식적인 수준에서 데이터 분석이라는 것이 무엇인지, 어떤 분야에서 활용될 수 있는지를 찾아나가고 탐구해가고자 합니다. 빅데이터라는 정체 모를 용어가 어느 순간에 급부상하면서, 기업 내 보유만 하고 크게 관심을 못 받던 데이터라는 것 자체에 관심이 쏠리기 시작했고, 함께 데이터분석이라는 분야도 새로이 조명을 받고 있는 듯 한 분위기 입니다.


아마도 회사에서 영업팀, 경영지원팀, 회계팀 등에서 필요로 하는 데이터를 데이터베이스에서 SQL을 사용하여 산출해 본 적이 있다면, 데이터분석과 상당히 가까워질 수 있는 기회가 많았다고 할 수 있을 것 같습니다. 대부분의 IT 분들은 산출한 데이터가 정확한지 정도를 체크하고 해당 팀에게 데이터를 넘겨주게 됩니다. 그러고서 끝이 났다면 데이터와 가까이는 있었지만 데이터분석은 수행되지 않았다고 할 수 있고 그런 의미에서 ‘구슬이 서 말이라도 꿰어야 보배’ 라는 속담이 떠오르게 되는 상황입니다. 데이터분석은 데이터로부터 현실에 유용할 만한 무언가를 찾아내는 것입니다. 그런 차원에서 데이터마이닝이라는 의미가 와 닿습니다. 광산에서 동굴을 파고 내려가면서 보석을 채굴하는 것과 같은 것입니다. 물론 쉬운 일은 아닙니다. 성공의 가능성도 희박합니다. 수많은 반복도 필요합니다. 그런 점에서 데이터마이닝이라는 이름은 잘 지어진 이름 같습니다


데이터분석도 그 수행에 있어서 수많은 반복작업이 포함되어 있을 뿐 아니라, 이보다 더 중요한 창의적인 접근이 필요하다고 합니다. 일반적으로 사람마다 동일한 데이터를 보면서 각기 다른 관점으로 바라보고 분석하게 됩니다. 한발 더 나아가자면, 데이터를 분석하여 어디에 쓸 수 있는가라는, 구체적인 활용에 대한 부분에 맞닥뜨리게 되면 더 중요해지게 되는 것이 창의성 및 인문학적 소양이라고 합니다. 데이터 분석이라는 것을 시작하기도 전에 요구하는 자질만 많은 것으로 들릴 수도 있겠네요. 여하튼 이 지점에서 짚고 넘어가고자 하는 것은 데이터베이스전문가와 데이터분석가는 데이터를 다룬다는 점에서는 같은 선상에 있는 것 같지만 분명히 차이점이 있다는 것입니다. 차이점이 있다는 것이 때론 넘을 수 없는 벽처럼 들릴 수도 있겠지만, 반대로 차이점을 알면 그에 따른 접근 및 해결방법을 찾아갈 수 있을 것이다라는 희망을 가질 수도 있는 것이니까요.


업무분석을 통해 데이터베이스를 잘 설계하고 서비스에 문제가 없도록 성능을 최적화하는 엔지니어적인 관점과, 작년 여름 성수기 시즌에 판매되었던 상품별 매출비중을 분석하여 판매전략을 어떻게 세워야 매출실적을 높일 수 있는가를 고민하는 업무적인 관점의 차이라고도 할 수 있습니다. 하지만 현대의 데이터분석은 대부분 출발부터가 IT 를 근간으로 합니다.  IT 없이는 필요한 데이터를 수집할 수도 적시에 산출할 수도 없습니다. 그런 점에서 데이터베이스전문가가 관심을 가지고 접근해 간다면, 데이터분석은 시너지를 내기에 적합한 분야로 보입니다. 물론 필요한 영역의 기본적 통계 지식과 데이터마이닝이라는 분야에 대해 지속적인 학습을 전제로 해야 한다는 고충이 있습니다. 하나 더 인문학적 소양과 비즈니스 경영에 관련된 책들도 읽는 수고도 따를 수 있겠네요. 그럼에도 불구하고 개인적으로는 관심이 계속 가는 분야여서 이렇게 글을 쓰고 있는가 봅니다.

 


 


현재도 치열한 비즈니스 세계에서 살아남기 위해 수많은 기업들이 시스템을 구축하고 적시에 활용하기 위한 노력을 하고 있습니다. 그 중에 데이터웨어하우스 라는 의사결정지원시스템(Decision Support System) 을 구축하는 목적은 회사의 중요한 의사결정을 할 때, 회사가 보유한 데이터를 통해 분석한 내용을 활용하겠다는 것입니다. 회사의 주요 고객군은 어떻게 되는지, 매출실적 상위를 차지하는 상품들은 무엇인지, 입점한 판매자중 누가 매출에 지대한 영향을 끼치는지 등의 기초적인 분석뿐 만이 아니라 상품별 고객이 느끼는 가격민감도를 분석하여 가격결정은 어느 수준으로 하여야 기업의 이윤이 최대가 되는지를 결정하는데 데이터를 활용할 수도 있습니다. 신도시에 새로운 상권이 생기면서 지점 런칭을 결정하고자 할 때, 그리고 런칭 한다면 매장규모는 어느 정도로 가져가야 최적인지를 결정하는데도 데이터를 활용할 수 있는 것입니다. 항공사라면 노선별, 시즌별, 시간대별 좌석점유율을 고려하여 최대의 이윤을 낼 수 있는 티켓판매가격을 결정할 수도 있겠지요. 모든 산업군에서 그 쓰임을 생각해 본다면 활용분야가 생각보다 크다라는 것을 금방 알 수 있습니다. 많은 기업들이 필요로 하고 데이터분석이라는 것을 관심 가지고 접하게 될 것은 자명해 보입니다.


여러분은 어떤 데이터를 접해 보셨나요? 그렇다면 그 데이터는 어떤 비즈니스적인 의미를 가지는지 고민 하신 적이 있으신가요?  ERD 그리고 AWR 과 성능최적화뿐 만이 아니라 데이터의 비즈니스적인 활용이 떠오르신다면, 데이터분석이라는 분야가 혹시 어울리실 수도 있다는 사실을 기억해 주시고요. 이번 글은 여기서 맺음 하도록 하겠습니다.