1. 서 론
기업의 공식적인 채널을 통해 수집되는 VOC(Voice Of Customer, 고객의 소리 이하, VOC)는 수많은 기업들이 제품 및 서비스의 질을 높이기 위해 주요한 자료로써 활용되어 왔다. 기업들이 품질기능전개(Quality Function Deployment)와 전사적 품질경영(Total Quality Management)을 이용하여 고객의 요구를 잘 반영한 맞춤형 제품이나 서비스가 기업 의 수익에 영향을 미치자 VOC의 비중은 지속적으로 증대 되어 왔다.
그러나 인터넷과 같은 다양한 매체의 발달은 VOC가 더 이상 고객의 의견을 대표하는 채널로서의 기능을 떨 어뜨렸다. 고객들은 제품이나 서비스에 대하여 말할 때, 공식적인 채널 보다는 다른 공간에서 말하고 있다. SNS 의 등장은 이러한 현상을 더욱 가속화 시키고 있다.
기업들은 이러한 문제를 해결하기 위하여 인터넷 커뮤 니티나 공식 SNS 사이트를 개발하는 등의 노력을 기울 이고 있지만 문제는 해결되지 않고 있다. 이러한 문제점 은 지속적으로 지적되어 왔으며 여러 가지 방법으로 해 결방안이 강구되기도 하였다. 최근 빅 데이터의 등장으 로 기업들이 이를 이용하여 VOC를 개선하려는 노력이 진행되고 있다. 고객관리를 위한 전담 시스템 및 부서 개 발, 사전경보시스템 개발들이 이에 해당한다.
그러나 이러한 노력들은 VOC와 외부채널과의 비교를 통한 차이점 분석 보다는 VOC의 발생원인, VOC 내부시 스템 개선에 관련된 부분이 주를 이루고 있다. 학계에서 도 이러한 경향이 주를 이루어 나타나고 있다. 국내 연구 들을 보더라도 고객들의 의견을 정확하게 반영하고 있지 못하다는 점에서는 공통적으로 일치를 이루고 있으나 그 해결방안에 대해서는 주로 VOC 시스템 내부 개선이나 새로운 시스템 개발, 또는 새로운 평가지표를 반영하는 방법이 대부분을 차지하고 있다. 현재 VOC가 가지고 있 는 가장 큰 문제들 중 하나는 VOC가 고객들의 의견을 반영하는 대표성이 떨어진다는 부분이다.
하지만 위에서 언급한 해결방안들은 VOC 시스템 내 부를 개선하는 부분에서는 긍정적일 수 있으나, 대표성 문제를 해결한다고는 보기는 어렵다. 다른 채널들의 의 견을 반영하여 VOC 시스템에 반영하는 방법이 아니기 때문이다. VOC에 대한 문제를 해결하기 위해서는 앞서 언급한 대표성 문제를 고려해야 한다. 본 연구의 목적은 VOC의 대표성 문제를 보완하여 고객의 다양한 의견을 반영할 수 있는 방법을 제시하고자 하였다.
본 연구에서는 기업이 인터넷 채널을 통해 공식적으 로 고객의 의견을 수집하는 VOC 자료와 해당 주제에 대하여 다른 인터넷 채널 자료를 비교하여 차이점을 분 석하기로 하였다. 분석을 위한 방법은 세 가지로 사회 연결망 분석, 모듈성 분석, 감성 분석이다. 각각 빈도수, 중심성, 극성(긍정과 부정)을 통해 결과를 비교하고 이 를 공통부분과 비 공통부분으로 나누어 차이점을 분석 하였다.
본 연구는 고객의 다양한 의견을 반영하지 못하는 VOC 의 문제점을 보완하기 위해 진행하였다. 본 연구의 결과는 VOC를 활용하여 제품 및 서비스 개발 및 개선을 해야 하 는 기업에 참고할 자료로서 도움을 줄 수 있을 것이다.
2. 선행연구와 이론적 배경
2.1 VOC
VOC는 1972년 고베 미츠비시 선박회사가 공정의 효 율성과 제품의 완성도를 위해 개발하여 1970년대 도요타 에서 활용된 품질기능전개의 한 요소이다. 품질기능전개 는 제조공정 전 단계에서 고객의 요구를 반영한다. 그렇 기 때문에 VOC는 품질기능전개에서 고객의 요구를 파 악하는데 있어 가장 중요한 역할을 차지한다. 품질기능 전개의 프로세스가 약 60%의 디자인 제작비용과 40%의 디자인 제작 시간 감소를 가져오자 1986년 포드와 제녹 스가 이 프로세스를 적극적으로 활용하기 시작했다. 이 후 품질기능전개가 확대된 형태인 전사적 품질경영 다수 의 미국기업들이 활용하기 시작했다. 이를 확인할 수 있 는 방법에 하나인 Malcolm Baldridge 모델(말콤 볼드리 지 모델, 이하 MB 모델)을 들 수 있다. 1990년 MB 모델 의 최소 요구조건이 18만 건에서 1991년 19만 건으로 증 가했지만 106개의 미국기업이 MB 모델 수상에 도전했 다. 이는 다수의 미국 기업들이 전사적 품질경영에 초점 을 맞추고 있다는 사실을 증명하는 결과이다.
거시적 관점의 마케팅 기법에서 품질기능전개는 시장 조사의 여러 가지 관점 중 기능적 측면에서 도움을 준다. 이는 전사적 품질경영 역시 마찬가지이다. 그리고 이러 한 기능들은 VOC에서 나온 데이터를 통해 각각의 이용 정도와 수요를 측정할 수 있다.
그러나 VOC가 각광받기 시작하면서 이에 대한 문제 점을 지적하는 연구도 발표되었다. Grrifin[10]이 휴대용 식기류를 사용하고 있는 고객들 중 30명을 무작위로 선 발하여 해당 제품에 대한 인터뷰 자료를 분석하였다. 그 결과 VOC에서 고객들이 불만사항을 언급하는 빈도수와 실제 제품이 중요하게 고려해야 할 부분이 불일치한다는 사실을 발표했다.
Singh[42]은 고객이 사용하는 제품이나 서비스가 불만 족스러운 경우, 이에 반응하는 고객의 유형을 연구하였 다. 그 결과, 직접적으로 해당 기업의 VOC 채널에 항의 를 하는 경우는 전체 37%에만 해당한다는 결과를 발표 하였다.
국내에서는 이수열 외[33]가 소비자 트렌드 변화를 고려 하지 않고 일반적인 분석 자료로써 활용되고 있는 VOC 의 문제점을 지적하였다. 그리고 이를 해결하기 위해서 소비자 트렌드에 따라 데이터베이스를 재구축 한 후, 상 품 및 월별 세부 분석을 통해 기업이 취할 수 있는 상품 관리와 시설관리 등 제반 조치사항을 준비하도록 하는 사전경보 VOC 시스템을 제안하였다.
우지영 외[44]는 다양한 고객의 의견을 체계적으로 분석하지 못하는 VOC 시스템의 문제점을 지적하고 해 결방안으로 고객의 소리 발생 원인을 분석하여 사후관 리 뿐 아니라 사전에 예방할 수 있도록 발생 변화 요인 에 따라 기존 요인에 VOC 발생에 영향을 많이 미치는 외부 환경적인 요인을 추가로 분석해야 한다고 주장하 였다.
2.2 사회연결망 분석(Social Network Analysis)
사회연결망 분석은 개체들 간의 사회적 관계를 구조적 으로 분석하여 내재된 관계를 파악하는 것을 말한다. 사 회연결망 분석을 활용하면 다양한 사건 혹은 집단의 구성 원들을 점으로 표현하고 이들 사의 관계를 선으로 나타 내어 구성원 사이의 의사소통이나 구성원 간 영향을 미치 는 정도를 정량화 하여 분석하는 것이 가능하다. 본 연구 에서는 사회연결망 분석의 하나인 키워드 분석(Keyword Analysis)을 활용하기로 하였다. 키워드 분석은 개체들 사 이의 중심성(노드와 노드 사이의 인접 정도와 영향성) 정 도를 측정하여 빈도순으로 결과를 정리하는 방법이다.
2.2 모듈성 분석(Modularity Analysis)
모듈성 분석은 단어들 간의 유사도(similarity)를 계산해 서 유사한 단어들을 몇 개의 집단으로 묶어주는 방법이다. 텍스트 데이터에 전통적인 군집 분석을 적용하는 것으로 문서 또는 텍스트 클러스터링(document, text clustering)이 라고도 한다. 모듈성 분석은 유사중복문서 검출(near duplicates detection : 문서가 완전히 일치하지는 않으나 많은 범위 내에서 일치하는 문서), 검색 엔진 최적화(search engine optimization : SEO, 웹 사이트가 검색엔진에서 검 색 시 상위에 링크되도록 하는 작업) 등에 응용되고 있다.
2.3 감성 분석(Sentiment Analysis)
감성 분석이란 문서를 작성한 사람들의 태도, 의견, 성향 과 같은 주관적인 데이터를 가지고 특정 주제에 대해 긍정 인지 또는 부정인지를 분류하는 기술로 오피니언 마이닝 (Opinion mining)이라고도 한다. 감성 분석은 문서를 작성 한 사람의 감정을 추출해 내는 분석 방법이기 때문에 문서 의 주체가 무엇인지 추출하기보다는, 그 문서를 작성한 사 람이 주제에 대하여 어떠한 감정을 가지고 있는가를 판단 하는 분석이다. 현재까지 감성 분석이 주로 적용되는 분야 로는 주로 온라인상에서 영화평, 도서평, 상품평 등에 대 한 분석이고, SNS 등장 이후로는 선거, 주식시장 예측 등 의 다양한 분야로 그 활용이 확대되고 있다. 감성 분석에는 다양한 기법이 있으나 본 연구에서는 Ridge(능형)와 Lasso (Least absolute shrinkage and selection operator) 회귀모형 을 이용한 예측 분석(Elastic net)을 활용하기로 하였다.
3. 분석 방법
<Table 1>은 VOC 자료와 외부채널 간 자료 분석에 대 한 절차를 6단계로 정리한 것이다. 그림에서 보는 바와 같이 6단계는 각각 분석방향 설정, 자료수집, 키워드 분석, 모듈성 분석, 감성 분석, 분석결과 비교로 이루어져 있다.
본 논문에서는 ‘제주도 관광’이라는 주제로 비교 대상 VOC 채널에서 빈도수, 군집정도, 긍정과 부정의 의미에 대하여 각각에 해당하는 기법들을 활용하여 차이가 있는 지에 대해서 분석해보고자 하였다.
분석방향설정에서는 전체적인 분석의 틀을 정하는 단 계이다. 본 연구에서는 기존 VOC 자료와 외부채널간의 비교를 통한 자료 간 차이점 분석을 실시하여 다양한 의 견을 반영할 수 있는 VOC의 방향에 대해 연구하고자 하 였다.
자료수집에서는 VOC와 외부채널 자료에 대한 수집방 법을 정하는 단계이다. 본 연구에서 VOC는 기업에서 공 식적으로 운영하는 인터넷 채널을 대상으로 하였다. 외 부채널 역시 인터넷자료인 포털사이트와 SNS으로 한정 하기로 하였다.
수집된 자료들은 총 3가지 분석을 거친다. 첫 번째로 키워드 분석에서는 각각의 자료를 주제와 관련된 단어들로 변환한 다음 빈도수를 기준으로 비교 분석을 실시한다.
<Figure 1>은 키워드 분석결과를 예시로 나타낸 것이 다. 특정 단어의 빈도수가 타 개체에 비해 높고 상관 비 율이 높은 해당 단어는 네트워크 가운데에 위치하여 연 결선이 굵게 표시된다.
모듈성 분석에서는 단어 간의 유사도를 측정한 뒤, 중 심성(centrality)을 기준으로 모듈화(군집화)시켜서 각각의 자료를 비교한다. <Figure 2>는 모듈성 분석결과를 예시 로 나타낸 것이다. 모듈성 분석을 통해 공통주제에 대한 각 채널의 내용들을 확인한다.
감성 분석에서는 앞선 분석을 통해 추출된 단어들을 긍정단어와 부정단어로 나누고 이에 대한 회귀계수를 측 정한다. 이를 통해 일반적으로 쓰이는 단어가 특정주제 에서 긍정인지 부정인지를 확인 하고 앞서 실시한 두 분 석결과와 비교하여 분석들의 신뢰성을 측정한다.
분석결과비교에서는 세 가지 분석결과를 나열하여 자 료간의 특성을 확인하는 단계이다. 여기서는 각각의 자 료에서 공통으로 도출된 부문과 한 채널에서만 도출된 비 공통부문으로 나누어 비교분석을 실시한다.
4. 사례 분석
4.1 분석방향 설정
본 연구에서는 제주도 관광에 대한 문제점을 분석하 기 위해 제주관광공사와 제주도에서 공식적으로 운영하 는 VOC 채널인 ‘제주관광신문고’와 외부채널과의 비교 분석을 통해 채널 간 특징을 파악하고 다양한 의견을 반 영할 수 있는 VOC의 방향에 대해 알아보고자 하였다.
4.2 자료수집
VOC자료는 제주관광신문고에 있는 공시 자료를 대상 으로 2014년 1월부터 2015년 12월까지의 자료 200건을 수집하였다. 외부채널 자료의 경우, 국내 포털사이트(네 이버, 다음 등)와 SNS로 한정하고 VOC 자료와 동일 기간 동안 웹 스크래핑(Web-Scrapping)방식을 통해 자료를 수 집하였다. 자료 수집 시, 검색어로서 긍정문서는 ‘제주도 관광 추천’이라는 키워드로, 부정문서는 ‘제주도 관광 문 제’라는 키워드로 검색했다. 검색 결과, 각각의 자료 99 건씩 198건을 수집하였다.
4.3 키워드 분석
4.3.1 제주관광신문고
제주관광신문고에서 수집한 VOC 자료 200건에 키워 드 분석을 실시한 결과 ‘제주도 관광 문제’에 대하여 언 급한 단어의 총 개수는 162개였다. 해당 단어들의 빈도 수를 모두 합한 건수는 2,820건으로 나타났다.
<Table 2>는 제주관광신문고의 키워드 분석결과를 상 위 10개 키워드를 중심으로 정리한 것이다. 키워드 분석 은 각각의 채널에서 나온 내용(문장)에서 명사를 기준으 로 나온 단어들을 빈도수에 따라 내림차순으로 정리한 것이다. 표에서 보는 바와 같이 제주관광신문고에서 가 장 많이 언급된 단어는 시간이었으며, 다음으로는 관광 객, 전화, 문제, 방문 순이었다. 그리고 위 결과를 바탕 으로 시각화 작업을 실시한 결과는 <Figure 4>와 같다. 그래프에서 보는 바와 같이 상위 10개 키워드들 중에서 가장 높은 빈도수를 보이는 시간은 전화, 문제, 관광객 과 같은 단어들과의 연결선이 굵게 나타나고 있어 해당 키워드들과 연관성이 높다는 사실을 확인 할 수 있다. 또한 문제를 중심으로 연결망을 살펴보면, 차량, 관광 지, 직원과 같은 단어들이 연관성이 높다는 사실을 확 인 할 수 있다. 이를 통해 제주관광신문고에서는 시간 이나 관광객 관련 내용이 자주 언급되고 있음을 확인 할 수 있다.
4.3.2 웹 스크래핑
제주관광신문고와 동일한 방법으로 외부채널을 웹 스 크래핑을 통해 수집한 99건의 자료에 대해 키워드 분석 을 실시하였다. 분석결과 단어의 총 개수는 43개이고 해 당 단어들의 빈도수 총합은 788건으로 나타났다. <Table 3>은 웹 스크래핑의 키워드 분석결과를 상위 10개 키워 드를 기준으로 정리한 것이다. 웹 스크래핑에서 가장 많 은 빈도수를 기록한 단어는 문제였으며 그 뒤로는 시간, 숙소, 사격, 렌터카 순이었다.
웹 스크래핑 역시 각각의 단어들의 연관성을 확인하 기 위해 시각화 작업을 실시하였다. 제주관광신문고 자 료와 비교하여 볼 때, 시간과 문제가 중심에 위치해 있다 는 것은 동일하지만 그 외에 일치하는 단어가 예약밖에 없다는 것을 확인 할 수 있다. 또한 문제를 중심으로 연 관성이 높은 단어가 숙소, 가격, 날씨로 제주관광신문고 와 차이가 있다는 것을 확인 할 수 있다. Figure 5
4.4 모듈성 분석
4.4.1 제주관광신문고
<Figure 6>은 제주관광신문고의 모듈성 분석결과를 그 래프로 나타낸 것이다. 그래프의 X축은 각각의 모듈들의 항목 개수를 나타낸 것이고 Y축은 모듈들의 번호로 임의 로 생성된다. 제주관광신문고 모듈의 총 개수는 399개이 며 이중 높은 중심성을 보인 모듈은 총 9개였다. 모듈성 분석을 측정하는 Modularity는 0.466으로 나타났다. 이 수 치는 1에 가까울수록 모듈화 정도가 높음을 나타낸다.
<Figure 7>은 제주관광신문고의 모듈성 분석결과를 구 체적으로 확인하기 위해 시각화를 실시한 자료이다. 그 림에서 동일한 색으로 연결된 모듈들은 같은 범주에 속 해있다는 것을 의미한다. 이 중 중심성이 높은 9개의 모 듈에서 제주도 관광 문제와 관련이 있는 단어를 분석한 결과, ‘관광객’, ‘직원’, ‘제주도’, ‘전화’, ‘예약’의 5가지 인 것으로 나타났다. 키워드 분석결과와 비교했을 때 공 통으로 도출된 단어는 ‘예약’ 하나였다.
4.4.2 웹 스크래핑
<Figure 8>은 웹 스크래핑에 대한 모듈성 분석결과를 그 래프로 나타낸 것이다. 모듈의 총 개수는 331개 이며 그 중 12개의 군집이 중심성이 높은 것으로 분석되었다. Modularity 는 0.675였다.
다음으로 분석결과를 시각화 시킨 결과 중심성이 높은 12개의 모듈 중에 주제와 연관성이 있는 것은 5개로 나타 났다. 5개의 모듈은 각각 ‘자동차’, ‘숙소’, ‘버스’, ‘공항‘이 었으며 키워드 분석결과와 공통으로 도출된 단어는 ‘숙소’ 하나로 나타났다. 이를 통해 웹 스크래핑 역시 제주관광신 문고와 마찬가지로 키워드 분석결과와 차이를 보였다.
4.5 감성 분석
4.5.1 제주관광신문고
<Table 4>는 제주관광신문고의 키워드 분석과 감성 분 석을 비교한 표이다. 제주관광신문고의 경우, 수집한 자료 200건 중 부정적 의미로 도출된 단어의 개수는 총 89개로 집계되었다. 분석결과 가장 높은 수치를 기록한 단어는 ‘항의’였다. 다음으로는 ‘진심’, ‘인간적’, ‘말씀’순이었다. 두 분석에서 동일하게 도출된 단어는 5개이며, ‘예약’이 두 분석 모두에서 높은 비중을 차지하고 있음을 확인 할 수 있다. 단, ‘문제’, ‘관리’, ‘관광객’, ‘전화’는 회귀계수가 높 진 않지만 부정의 의미로 쓰였다는 것을 확인 할 수 있다.
같은 방법으로 모듈성 분석과 감성 분석을 비교한 결과, 제주도를 제외한 나머지 4개 단어가 모두 감성 분석에 포 함되어 있었다. 이를 통해 키워드 분석보다는 모듈성 분석 이 감성분석결과와 유사하다는 사실을 확인 할 수 있다.
4.5.2 웹 스크래핑
웹 스크래핑을 통해 수집한 자료 중에서 공통어를 제 외한 부정적 의미의 단어는 31개로 집계되었다. 분석결 과에서 회귀계수가 가장 높게 나타난 단어는 ‘문제’였고 다음으로는 ‘불만’, ‘안심’, ‘예약’ 순이었다. 키워드 분석 결과와 동일하게 나온 단어의 수는 4개로 제주관광신문 고와 비슷한 수준으로 일치했다. 단, ‘숙소’를 제외한 3개 의 단어는 모두 감성 분석에서 높은 수준의 비중을 차지 하고 있는 것으로 나타났다.
마찬가지로 웹 스크래핑의 모듈성 분석과 감성 분석의 내용을 정리한 결과 두 분석에서 공통으로 도출된 단어 는 ‘숙소’와 ‘버스’였다. 이를 통해 웹 스크래핑의 자료가 제주관광신문고 보다는 감성분석결과의 일치 비율이 낮 은 것을 알 수 있다.
4.6 분석결과 비교
<Table 8>은 앞서 실행한 3가지 분석결과를 채널을 기 준으로 정리한 것이다. 각각의 채널에서 공통으로 2번 이 상 나온 단어들은 ‘문제’와 ‘예약’이었다. ‘예약’의 경우 두 채널 모두 동일한 내용의 문제점을 지적하고 있었다. 관련 세부항목들을 보면 예약내용과 실제 서비스이용과의 차이 가 다수를 차지했다. 이를 통해 제주도 관광 문제 중 예약 과 관련한 사항이 가장 시급하게 개선되어야 할 사항이라 는 것을 확인 할 수 있다. 단 ‘문제’의 경우, 세부 항목에서 자료 간 내용의 차이를 보이고 있다. 분석결과를 비교해 보면 제주관광신문고에서는 공공시설에 대한 내용이 다수 를 이루고 있지만 웹 스크래핑에서는 사설 업체들에 대한 내용이 주를 이루고 있다. 이를 통해 각각의 채널에서 공 통으로 언급된 단어라도 세부항목에서 내용상의 차이가 있을 수 있다는 사실을 알 수 있다.
비 공통부문에서는 이러한 차이가 좀 더 자세히 드러 난다. 제주관광신문고에서 도출된 단어들 중 3가지 분석 에서 2번 이상 나온 단어는 ‘관광객’, ‘전화’, ‘직원’이었 다. 단어의 세부 항목들을 살펴보면 제주관광신문고에서 는 웹 스크래핑에 비해 서비스를 제공하는 직원들의 친 절에 관련된 사항이 많다는 것을 확인 할 수 있다.
웹 스크래핑 분석결과에서 2번 이상 도출된 단어는 ‘숙 소’, ‘렌트카’, ‘예약’이었다. 공통부문인 ‘예약’을 제외하고 세부내용을 살펴보면 웹 스크래핑에서는 시설 및 서비스를 이용하는데 있어 발생하는 불만이 많다는 사실을 확인 할 수 있다. 이를 통해 공통주제라고 하더라도 채널에 따라 발생하는 내용에는 차이가 있다는 것을 확인 할 수 있다.
5. 결 론
본 연구에서는 VOC 자료와 외부채널 간의 데이터 비교 를 통하여 VOC의 문제점을 확인하고 VOC가 다양한 의견 을 반영할 수 있는 자로로써 활용될 수 있는 방향성에 대 하여 연구해 보았다. 빈도수를 기준으로 자료 간 상호비교 를 실시하는 키워드 분석결과, 공통으로 도출된 단어보다 는 비 공통부분의 단어가 더 많이 도출되는 것을 확인 할 수 있었다. 또한 공통부분에서도 세부항목에서 차이를 보 였다. 단어 간 유사도를 측정하여 중심성을 기준으로 각각 의 자료의 차이를 확인하기 위해 활용한 모듈성 분석에서 는 키워드 분석결과보다 비 공통부분의 비중이 높았다. 감 성 분석에서는 회귀 분석을 통해 측정된 회귀계수와 앞선 두 분석결과와의 비교를 통해 분석 방법의 신뢰성을 검증 하고자 하였다. 분석결과, 차이는 있으나, 대체적으로 키 워드 및 모듈성 분석결과와 일치하는 것으로 나타났다. 본 논문은 각각의 분석의 기준(빈도수, 군집정도, 긍정과 부 정)에 따라 분석을 실시하였다. 분석결과 빈도수와 군집정 도(단어 간 공통적으로 도출 또는 유사성), 그리고 긍정과 부정정도에서 각 채널의 결과가 일치하지 않았다. 이를 통해 공통주제라 할지라도 채널에 따라 내용이 달라질 수 있다 는 사실을 확인하였다. 본 연구의 결과는 VOC를 활용하고 있는 기업 및 공공기관에서 다양한 의견을 반영하여 VOC 의 문제점을 보완하는 방법으로 활용될 수 있다. 단, 웹 스크래핑 자료 뿐 아니라 더 많은 외부채널들을 활용하고, 감성 분석 시에 사용하는 긍정 및 부정 단어들에 대한 기 준 관련 연구가 필요하다.