1서 론
빅데이터는 2011년 급격하게 이슈화된 이후 현재까지 계속 새롭게 정의되고 있는 개념이다. 데이터 처리는 빅 데이터 이슈화 전에도 계속 논의되었던 사안이지만[33], 다시금 관심이 집중되는 것은 다양한 산업 분야에서의 전자화, 자동화로 처리 가능한 다량의 데이터가 확보되 고 이를 분석하여 가치를 도출함으로써 기업의 비즈니스 고도화 및 효율화를 추구하는 목적 때문으로 분석된다.
또한 기업 및 국가 간의 기술 격차 감소로 경쟁이 매 우 치열해졌고[29], 급변하는 환경 속에서 실시간으로 쏟 아지는 빅데이터를 처리할 수 있는 기술적 요소, 인력이 별도로 필요해지면서 이에 대한 투자, 관심 및 시장이 갈 수록 확대되어 가는 추세이다.
해외 선진국 및 우리나라 정부는 국가 경쟁력의 일환 으로 빅데이터에 대한 중요성을 인식하여[32] 다양한 빅 데이터 관련 사업을 추진(예정 포함) 중에 있으며, 빅데 이터 활용 확대와 비용 투자를 장려하고 있다. 또한 기업 수준에서도 빅데이터를 활용한 분석을 통해 성공적인 효 과 사례를 제시하고 있다.
그러나 대기업, 공공기관을 제외한 국내 대부분의 기 업들은 빅데이터 활용도가 낮으며 도입을 시도 중인 형 국이다. 국내 빅데이터 문헌 역시 빅데이터 분석 기술, 개인정보 보안, 빅데이터 인력 양성 등 특정 카테고리에 국한되어 연구가 진행되고 있으며 특히 기술 분야에만 중점적으로 논문이 게재되고 있다[44].
기업이 빅데이터를 활용하기 위해서는 체계적인 도입 전략과 함께 관련 역량 관리 및 추가 비용 부담이 없는 선에서의 보완이 가능해야 하며[42], 기업의 빅데이터 성 숙도 단계 및 보유 역량이 어느 정도 수준인지 평가할 수 있는 프레임워크가 필요하다.
현재 전반적인 국내 빅데이터 성숙도 역량 모델 및 진 단시스템에 대한 연구는 미흡한 실정이며, 국내의 빅데 이터 역량평가 모델로는 2014년에 배포된 한국정보화진 흥원의 시범모델인 빅데이터 역량진단도구(Big-CAT)가 존재한다[6]. 그러나 이 모델은 기업 전체의 빅데이터 수 준 제시 및 통합적인 서술 결과를 다루고 있어 기업이 구체적으로 관리 요소를 도출하고 적용하기에 용이하지 않은 한계점이 있다. 이러한 현 상황 및 시대적 흐름을 반영하면 빅데이터 도입/운영과 활용에 대한 심화된 연 구가 필요해지는 것은 당연한 수순으로 보인다.
따라서 본 연구에서는 상대적으로 선행연구가 진행되고 있는 해외의 빅데이터 및 BI(Business Intelligence), KM (Knowledge Management), DM(Data Management) 등 분 야의 여러 성숙도 역량 모델을 참고하여 세분화된 관리 영역 및 구체적인 평가요소를 정의한 빅데이터 참조모델 을 개발하고, 이를 기반으로 한 수준진단시스템을 제시 함으로써 기업의 역량 수준 평가 및 빅데이터 전략 수립 에 도움을 주고자 하였다.
본 연구에서 제시하는 빅데이터 참조모델은 기업의 빅데이터 수준을 나타내는 성숙도 단계, 중점적으로 관 리가 필요한 평가영역, 각 단계 및 영역별 빅데이터 역량 을 판단하기 위한 평가요소로 구성된다. 수준진단시스템 은 평가요소를 기반으로 진단항목을 도출하였으며 분석 결과, 가이드라인, 시사점을 제공한다.
본 연구의 구성은 다음과 같다. 제 2장에서는 빅데이 터에 대한 이론적 고찰을 통해 빅데이터에 대한 이해를 돕고 제 3장에서는 국내외 빅데이터 참조모델 선행연구 를 통해 제시하고자 하는 참조모델의 구성요소를 정의 한다. 제 4장에서는 빅데이터 참조모델의 단계별, 관리 영역별 평가요소를 구체적으로 제시한 후 수준진단시스 템의 진단항목 및 가이드라인을 도출한다. 마지막으로 제 5장에서는 본 연구의 결론 및 향후 연구과제에 대해 논의한다.
2빅데이터 선행연구
2.1빅데이터의 정의
빅데이터란 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 데이터 를 의미하며[19], ‘그레이 데이터(Gray Data)’ 혹은 기업 데이터, 오픈데이터, 소셜 데이터로 통칭하여 불린다.
빅데이터라는 단어의 시작은 2010년 2월 ‘이코노미스 트’지 커버 이미지에 실린 ‘The data deluge-데이터 폭우 에 대한 스페셜 리포트’이며[25], 최초의 빅데이터 정의는 Teradata Magazine Article에서 가트너의 Merv Adrian(2011) 에 의해 언급되었다[7].
이후 맥킨지, IDC 등의 기관에서 가트너가 제시한 <Figure 1>의 규모(Volume), 종류의 다양성(Variety), 속도(Variety) 의 3V의 특성을 기반으로 하여 주관적으로 빅데이터의 개념을 정의하였으며, 현재까지도 여러 연구자 및 기관 을 통해서 계속 다양하게 정의가 추가되고 있고 그 의미 가 확대되고 있다[24].
2.2빅데이터의 시장현황
빅데이터 시장은 물리적 하드웨어에서부터 인프라 소 프트웨어를 거쳐 서비스 소프트웨어 부문으로 확장되고 있으며 애플리케이션을 제공하는 거대한 플랫폼 시장으 로 변화해가고 있다[31].
<Table 1>은 IDC[23]와 한국과학기술정보원[18]에서 발표한 빅데이터 주요 세그먼트 별 국내외 시장 규모 전 망으로, 각 기관은 계속적으로 국내외 빅데이터 수요 시 장이 커질 것으로 전망하고 있다.
2.3빅데이터 활용사례
빅데이터는 기업의 비즈니스 영역에 새로운 사업방식 을 도입하는 변화를 초래할 것으로 보인다[34]. 빅데이터 활용 분야는 무궁무진하며, 각 분야별로 고유한 특성을 갖고 있다[1].
빅데이터의 산업별 분석대상 데이터 및 국내외 활용 사례는 다음과 같다.
-
자동차산업
-
- 차량에서 생산되는 각종 데이터, 제조․폐기단계 축적 데이터, 고객 데이터
-
- 구글, 포드자동차의 연료배분 제안 서비스[19]
-
-
건설업
-
- 원자재 가격 데이터, 고객 피드백 데이터 등
-
- 현대건설의 품질우수 및 실패사례 피드백[17]
-
-
헬스케어산업
-
- 제약사 연구개발데이터, 환자치료 임상데이터
-
- 미국 세톤 헬스케어패밀리병원의 환자 임상정보 분 석 사례[28]
-
-
소매유통업
-
- 고객 거래 데이터, 고객 구매 경향
-
- 헹켈의 칼 판매량 감소원인 SNS 분석[33]
-
-
통신산업
-
- 고객 데이터, 가입자 송수신 통화내역 데이터
-
- 영국 O2 통신사의 할인쿠폰발송 프로모션[34]
-
-
교통산업
-
- 도로센서네트워크 데이터, 사건사고 로그
-
- 와이즈넛의 빅데이터 이용 선로 고장 예방 솔루션[21]
-
-
물류산업
-
- 차량 위치, 경로 데이터, 실시간 화물상태
-
- CJ 대한통운의 스마트 통합 단말기 사용[45]
-
-
공공서비스업
-
제조산업
-
- 원자재 가격 데이터, 고객사 수요 데이터
-
- 웨스턴 디지털의 제품 결함률 감소[41]
-
-
바이오산업
-
- DNA 염기서열 데이터
-
- 미국 AM 바이오테크놀로지의 DNA 염기서열 분석[46]
-
-
보안산업
-
- 센서 데이터, 기상상황 데이터
-
- 미국 테라에코스의 주변 침입 감지[46]
-
-
금융업
-
- 고객 위치, 거래 데이터, 시장 데이터
-
- 미국 비자 아멕스의 타켓 마케팅 프로그램[9]
-
-
IT산업
-
- 기업제공 서비스에서 수집한 데이터
-
- 다음소프트의 소셜 메트릭스 서비스[27]
-
언급한 산업 활용 사례 이외에도 레저산업, 기상산업, 전기산업, 항공우주산업, 은행업 등 빅데이터를 활용하 는 분야는 무궁무진하게 많다. 빅데이터 분야는 미래가 기대되는 분야 중 하나이다.
3빅데이터 참조모델 개발
3.1참조모델 개발 절차
제 3장에서는 <Figure 2>의 빅데이터 참조모델 개발 절차에 따라 제 2장의 빅데이터 선행연구 및 제 3.2절의 참조모델 선행연구를 바탕으로 참조모델의 성숙도 단계 를 정의하고 관리 영역의 구분 및 관리 영역별 세부 요 소를 구체적으로 도출하여 빅데이터 참조모델 프레임워 크를 제시하고자 하였다.
3.2참조모델 선행연구
빅데이터 역량 평가 및 빅데이터 도입에 관한 국내 연 구는 미비한 상태로, Big-CAT 모델을 제외한 나머지에서 는 적합한 기존연구를 찾기 어려웠다.
따라서 본 연구에서는 해외의 빅데이터 분야 및 BI(Business Intelligence), KM(Knowledge Management), DM(Data Management) 등의 타 분야에서 활용되고 있는 모델을 포함하여 선행연구를 탐색하였고 본 연구의 목적에 적합 한 참고 가능한 24개의 모델을 다음과 같이 추려내었다.
-
TDWI’s Big Data Maturity Model[15]
-
BSM’s Maturity Model[8]
-
IDC’s Cloud Maturity Model[22]
-
CMM[36]
-
CMMI ver. 1.3[38]
-
CPM Maturity Model[11]
-
ANDS’s DM Framework[4]
-
Oracle’s IM Reference Architecture[42]
-
HP’s BI Maturity Model[20]
-
DAM-MM[13]
-
EBI-MM[39]
-
Gartner’s Business Analytics Framework[40]
-
Gartner’s EIM-MM[14]
-
Meta-Architecture Maturity Model[49]
-
SAUG’s BI Maturity Model[16]
-
Redwing Consulting[43]
-
Markus Sprenger’s Big Data Maturity Model[37]
-
Andrew McAfee and Erik Brynjolfsson[3]
-
Wayne Eckerson[48]
-
Tony Shan[47]
-
ECM Maturity Model[2]
-
Radcliffe’s Big Data Maturity Model[26]
-
CBIG consulting[10]
-
Big-CAT[6]
각각의 참조모델 선행연구 분석 결과, 대부분의 모델 은 4~6개 사이의 성숙도 단계로 구성되어 있었으며 일부 를 제외하고 기본적으로 3~5개 사이의 평가영역으로 분 류되었다.
3.3빅데이터 참조모델 구성요소
본 절에서는 제 3.2절에서 제시한 기존 모델 연구를 통해 본 연구에서 제안하는 빅데이터 참조모델의 구성 요소를 도출하고 그 개념들을 정의한다.
기존 모델을 살펴보면, 국내 모델의 경우 역량 분류에 주안점을 두고 기업의 빅데이터 사용 방식에 따라 맞춤 형 수준진단을 할 수 있는 장점이 있으나 각 역량에 대 한 개념적인 서술 및 기업 전체의 빅데이터 수준만을 알 려주는 데 그치고 있다.
해외 모델의 경우 TDWI 성숙도 모델은 기술 관점을 바탕으로 그 외 문화, 조직 등 다양한 관점에서 바라보는 장점이 있으나 데이터 관리와 기술 측면을 강조하여 구 성원의 빅데이터 관련 교육이나 데이터 시각화 등에 대 해서는 자세히 다루지 않았다. 그리고 Markus Sprenger 의 성숙도 모델은 빅데이터 성숙도 단계에 대해 명확하 게 정의를 내려주고 있으나 단계별 구성 요소에 대한 설 명이 부족하다. Radcliffe Advisory 모델의 경우 단계별 기업의 행동 플랜이 잘 제시되어 있으나 관리 영역이 명 확히 정의되어 있지 않다.
따라서 본 연구에서는 좀 더 폭 넓은 관점 및 구체적 인 요소의 도출을 목적으로 하여 빅데이터 수준진단모델 에서 적용되었던 구성 요소들과 함께 타 분야에서 사용 되는 기존 성숙도 모델, 역량 모델의 단계 및 구성 요소 들을 추가하여 본 연구에서 제시하고자 하는 참조모델의 구성 요소들을 정의하였다.
3.3.1성숙도 단계 정의
제 3.2절에서 선행연구를 정리하면 기존의 모델 대부 분은 4~6단계로 구성되어 있고 CMM(Capability Maturity Model)의 5단계 성숙도 개념을 기반으로 하며, 혹은 CMM 과 유사한 성숙도 개념을 적용하고 있다.
따라서 본 연구에서 제안하는 빅데이터 참조모델은 CMM의 성숙도 단계의 명칭과 기존 빅데이터 수준진단모 델의 성숙도 단계 개념을 적용하여, 각 성숙도 단계를 아 래와 같이 Ad Hoc, Repeatable, Defined, Managed, Optimizing의 다섯 단계로 정의하였다.
-
[Level 1] Ad Hoc
전반적으로 빅데이터에 대한 인식이 낮으며 사용 가 능한 데이터가 거의 없고 제한된 범위 내에서만 분석 이 운용되는 단계
-
[Level 2] Repeatable
빅데이터에 대한 구성원의 인식 변화가 일어나며 빅 데이터 지식 및 기술을 습득하고 기업고유의 데이터 인프라스트럭처와 플랫폼을 구성하나, 툴과 기술이 제 한적인 단계
-
[Level 3] Defined
빅데이터 분석 활동이 시작되며 효율적인 데이터 사 용이 가능하고 다양한 종류의 빅데이터 기술과 데이터 거버넌스가 존재하며 외부 데이터에 대한 이해도가 높 은 단계
-
[Level 4] Managed
빅데이터 분석이 중요해지며 분석문화가 우세해지는 단계, 예측분석과 시각화 어플리케이션 사용이 가능하 며 IT 아키텍처가 내부자원의 보안을 보장하는 단계
-
[Level 5] Optimizing
빅데이터 분석이 비즈니스 모델 수립에 깊게 연관되 며 데이터가 강력한 데이터 거버넌스 하에 조직 전체 로 공유되는 상태, 예측분석에 대한 보완이 가능하고 발전된 데이터 시각화가 수행되는 단계
본 연구의 참조모델은 CMM 모델과 달리 성숙도 1단 계의 명칭을 initial 대신 Ad Hoc을 사용하였는데, Ad Hoc은 CMM에서 initial 단계의 조직의 상황을 설명하는 특징을 지칭하는 것으로 좀 더 기업의 상황을 직접적으 로 표현할 수 있는 명칭이라 판단하여 단계 명을 Ad Hoc으로 수정하였다.
3.3.2평가영역 정의
참조모델의 주요 구성 요소 중 하나인 평가영역은 빅데 이터 역량 평가에 있어 중점적으로 다루어야 하는 영역으 로 정의된다. 본 절에서는 이러한 평가영역들을 규정하기 위하여 MIS의 프로젝트 운영관리 3요소인 People, Organization, Technology에 따른 영역 구분을 기본적으로 차용하 였고, Technology를 하드웨어 부분과 소프트웨어 부분으로 분리시켜 Infrastructure와 Analytics로 구분하였다.
그리고 제 3.2절에서 각 선행연구 모델의 평가영역을 종합하면서 빅데이터 역량에 있어 가장 중요한 데이터 자 원 영역을 함께 추가하여 아래와 같이 Organization, Resource, Infrastructure, People, Analytics 등의 다섯 개의 빅 데이터 참조모델 평가영역을 도출하였다.
-
Organization Dimension(조직 영역)
빅데이터에 대한 경영층의 인식 및 리더십, 분석 중심 의 조직문화, 빅데이터 지원 및 수행 프로세스, 전략과 연계된 데이터 거버넌스 등에 대한 성숙도를 평가하는 영역
-
Resource Dimension(자원 영역)
빅데이터 분석에 사용되는 데이터의 보유와 품질 관리, 신뢰도, 데이터의 인프라스트럭처 지원, Original data와 Processed data 간 통합 여부 및 보안 관리 등 데이터 자원의 성숙도를 평가하는 영역
-
Infrastructure Dimension(인프라스트럭처 영역)
빅데이터를 지원하는 인프라스트럭처와 플랫폼, 기업 과 잠재적 고객 간의 연결 지원 아키텍처, 보안 문제, 빅데이터 관리 기술 역량 등 기술 하드웨어 측면에 대 한 성숙도를 평가하는 영역
-
People Dimension(구성원 영역)
기업 구성원의 보유 빅데이터 스킬과 경영-IT 부서 간 협력, 관리 시스템 수행능력, 빅데이터 관련 교육 및 컨퍼런스 참여 등 조직 구성원의 빅데이터 보유 기술 및 수행능력에 대한 성숙도를 평가하는 영역
-
Analytics Dimension(분석 영역)
기업의 데이터 분석 역량과 예측분석 등의 분석기술, 비즈니스 모델 수립 시 분석기술 적용, 데이터 시각화 기술 등 기술 소프트웨어 측면에 대한 성숙도를 평가 하는 영역
3.4연구모형
제 3.3절에서 정의한 참조모델의 구성요소인 성숙도 단계와 평가영역을 이용하여 개발한 빅데이터 참조모델 의 프레임워크는 <Figure 3>과 같다.
3.5빅데이터 참조모델 세부관리요소
참조모델의 세부관리요소를 도출하기 위하여 기존연 구 모델들의 평가영역 내 세부 요소를 종합하여 본 연구 의 참조모델의 평가영역 구분으로 맵핑작업을 하였으며 각 평가영역에서 주요 평가요소 항목을 도출한 결과는 다음 <Table 2>와 같다.
각 평가영역은 다섯 개의 성숙도 단계별로 다시 세부 적으로 정의되며, 성숙도 단계별 해당하는 세부관리요소 를 선행연구를 참조하여 작성하였다.
<Table 3>는 참조모델의 성숙도 단계에 따른 영역별 관리요소를 정리한 표이다.
4수준진단시스템 설계
본 연구에서는 빅데이터 관리자가 빅데이터를 어떻게 사용해야 하는지, 또한 기업의 현재 빅데이터 역량 수준 을 파악하고 빅데이터 목표를 수립하기 위해 어떠한 전 략을 도출해야 하는지에 관해 도움을 줄 수 있는 빅데이 터 수준진단시스템을 설계하였다.
4.1진단 프로세스
-
[Step 1] 현황 파악
수준진단시스템 수행 전 기업이 처해있는 경영환경, 기업 보유 인력, 빅데이터가 적용 가능한 범위 혹은 프로젝트의 유무 등을 판단한 후 진단을 수행할 수 있 도록 함.
-
[Step 2] 시스템 진단
수준진단시스템은 5개 영역으로 구성되어 총 50개 문 항으로 이루어져 있음. 기업의 빅데이터 담당자가 진 단시스템을 수행하며 프로토타입의 엑셀을 기반으로 체크 및 설문 항목에 대한 응답을 작성함.
-
[Step 3] 결과 분석
Step 2가 완료되면 바로 진단 결과가 도출되며, 먼저 기업의 각 평가영역별 성숙도 단계가 제시되며 단계 에 해당하는 수준에 대한 설명을 안내 받음. 이후 영 역별 세부 설명과 개선사항, 과제 및 시사점이 제시됨.
-
[Step 4] 설명회
진단이 모두 완료된 후 TFT팀 또는 관련 부서 직원에 게 결과를 공유하며, 결과 데이터를 바탕으로 기업의 향후 빅데이터 관리 방안에 대한 논의 및 전략 수립과 관련한 제안, 설명회를 수행할 수 있음.
4.2메인 페이지 설계
본 수준진단시스템의 메인 페이지는 수준진단시스템 에 대한 개요 및 기본 안내사항 및 주의사항에 대한 내 용을 포함한다.
4.3진단 항목 설계
빅데이터 수준진단시스템은 각 평가영역별로 질문 항목에 응답하는 방식으로 실시되며, 설문문항의 경우 <Figure 4>의 설문진단 항목 설계를 기초로 평가영역 당 10개씩 진단 항목이 지시되어 총 50개의 문항이 설 계되었다.
4.4진단 결과 설계
진단 결과는 요약 보고서의 형태로 제시되며 각 영역 별 성숙도 단계 진단 및 점수 제공, 진단 결과의 해석, 영역 내 평가요소 별 점수, 결과에 따른 개선사항 및 시 사점을 포함한다.
5결 론
빅데이터는 정보를 처리하는 새로운 패러다임으로써, 기업이 빅데이터를 보유하고 활용한다는 것은 전통적인 방식에서 벗어나 새로운 방식으로 비즈니스 모델을 수립 하고 데이터를 저장, 관리, 분석하는 방식을 도입함을 의 미한다. 결국 지속적으로 생성되고 있는 다양한 데이터의 확보와 그 속에서 숨겨진 가치를 찾고 인사이트(insight) 를 도출하는 것이 데이터 폭증 시대의 새로운 경쟁력이 되는 것이다[35]. 기업이 빅데이터에 대해 더 많이 이해할 수록, 현 수준에서 갖추어야 할 필요 요소들을 알수록 빅 데이터 시대의 기업 경쟁력은 강화될 것이다.
해외의 다양한 글로벌 산업군 기업들은 계속적으로 성공적인 빅데이터 활용사례의 수를 증가시켜가고 있으 며, 국내에서는 평판 분석, 국가 정책 여론 파악 등 제한 된 기술을 보유한 기업이 등장하였으나 글로벌 기업에 대비하여 기술 수준 및 경쟁력이 취약한 편이다[1].
따라서 본 연구는 기업이 빅데이터를 도입 혹은 활용 하기 이전에 시행하는 기업의 역량 수준 평가에 도움을 줄 수 있는 참조모델을 개발하고 이를 기반으로 한 수준 진단시스템을 통하여 기업의 빅데이터 도입 전략 수립에 밑거름이 되고자 하였다.
본 연구에서는 국내의 기존 문헌자료가 부족하여 해 외 실정에 국한된 참조모델 내 세부 요소 설계 및 진단 시스템 항목 설계가 이루어졌기 때문에, 국내 기업이 유 용하게 활용하기 위해서는 국내 실상에 적합한 평가 항 목 보완이 필요할 것으로 판단된다. 향후 연구과제로 추 가적인 기업 데이터 및 사용 데이터의 수집을 통해 각 산업과 업종에 적합한 수준진단시스템을 개발하는 연구 가 필요할 것이다.