Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.36 No.1 pp.64-69
DOI : https://doi.org/10.11627/jkise.2013.36.1.64

공용환경 설계를 위한 선호도 기반 클러스터링

손기혁*, 옥창수**†
*한국생산성본부, **홍익대학교 산업공학과

Preference‐based Clustering for Intelligent Shared Environments

Chang-Soo Ok**†, Kihyuk Son*
**Industrial Engineering, Hongik University
*Korea Productivity Center
Corresponding Author okcs@hongik.ac.kr
Received 26 January 2013; Finally Revised 5 February 2013; Accepted 18 February 2013

Abstract

In ubiquitous computing, shared environments adjust themselves so that all users in the environments are satisfied as possible.Inevitably, some of users sacrifice their satisfactions while the shared environments maximize the sum of all users’ satisfactions.In our previous work, we have proposed social welfare functions to avoid a situation which some users in the system face theworst setting of environments. In this work, we consider a more direct approach which is a preference based clustering to handlethis issue. In this approach, first, we categorize all users into several subgroups in which users have similar tastes to environmentalparameters based on their preference information. Second, we assign the subgroups into different time or space of the sharedenvironments. Finally, each shared environments can be adjusted to maximize satisfactions of each subgroup and consequentlythe optimal of overall system can be achieved. We demonstrate the effectiveness of our approach with a numerical analysis.

1. 서 론

유비쿼터스 컴퓨팅은 우리를 둘러싸고 있는 환경에 보이지 않게 설치된 컴퓨터들이 인간과 자동 상호작용을 통하여 환경이 그 속에 존재하는 사람에 적응해간다는것을 기본개념으로 한다[13]. 이와 같은 지능 환경의 구현은 최근 컴퓨터, 제조, 통신 기술의 발달로 점점 더 가속화되고 있다. 대부분의 유비쿼터스 컴퓨팅 기술 개발은 유비쿼터스 환경과 개인 간의 상호작용에 대한 연구로 집중되고 있고 많은 연구 성과를 보여 왔으나[1, 7, 11, 12] 여러 사람이 동일한 시간에 모여 있는 공유환경의 경우에는 상대적으로 적은 연구가 진행되고 있다[9]. 사실, 유비쿼터스 컴퓨팅(Ubiquitous computing) 기술을 여러 사람이 함께 사용하는 사무실, 거실, 강의실, 헬스장과 같은 공유환경(Shared environments)에 적용함으로써 얻을 수 있는 삶의 질의 향상은 대단히 크다. 이는 온도, 밝기, 소음 등과 같은 환경 매개 변수(Environmental parameter)의 조절을 통해 그 환경 내에 존재하는 사람들에게 적합한 환경을 제공할 수 있음을 의미한다. 이와 같은 지능형 공유환경은 우리 생활 어디에나 존재할 수 있으며 그 환경의 적절한 제어 방법의 연구는 유비쿼터스 컴퓨팅에 의해 얻게 되는 효용성 증대에 필수적이다[8, 12]. 그러나 이러한 기술이 실제 생활에 적용 또는 상용화되기 위해서 선결되어야 하는 많은 문제들(Issues)이 존재한다. 

옥창수 등[9]은 환경설정에 대한 서로 다른 선호도를 가지고 있는 사람들이 공유환경에 존재할 때 환경설정을 위하여 개인들의 선호도를 통합(Aggregation) 방안에 대한 연구를 실시하였다. <Figure 1>은 지능형 공유환경의 일반적인 구조(Architecture)를 보여준다. 현재 공유환경내에 있는 개인들의 선호도를 유비쿼터스 인터페이스를 통해 수집하여 의사결정시스템에 전달하면 이 정보를 바탕으로 의사결정 시스템은 하나의 대안을 선정하고 이에 따라 지능형 공유환경은 설정된다. E와 e∈E를 각각 환경 설정 대안들의 집합과 각 환경 대안이라고 하고 Pa(e)를 개인 a의 환경설정 e에 대한 선호도라고 하면 의사결정 시스템은 하나의 대안을 선택하기 위하여 통합함수, W(e)=f({Pa(e):a∈H}), 가 필요하게 된다. 단, H는 현재 공유환경 내에 있는 개인들의 집합이다. <Table 1>의 예제는 세 명의 사람이 어떤 공유환경 내에 있고 그 환경설정 대안이 A, B 두 가지 일 경우, 현재 가장 많이 사용되고 있는 평균을 통합함수로 사용할 경우 개인 1의 희생이 강요되기 때문에 평균은 항상 좋은 통합함수라고할 수 없고 이러한 문제 상황을 피하기 위하여 사회후생 함수를 활용한 새로운 통합함수를 개발하여 공용환경에적합한 의사결정구조를 제안하였다. 

<Figure 1> Architecture of Intelligent Shared Environments.

<Table 1> Aggregate Function for Intelligent Shared Environments.

본 연구에서는 [5]에서 개발된 통합함수와 평가지표를 활용하여 주어진 집단을 비슷한 선호도를 가진 여러개의 소그룹으로 나눌 때 사용하는 클러스터링 기법을 제안한다. [5]에서는 선호도가 다른 개인들이 하나의 공용환경에 존재할 때 이 개인들의 만족도를 최대화하는 환경 설정문제를 다루었다. 이와는 달리 본 연구는 여러개의 물리적 또는 시간 별 공용장소가 존재하는 경우 비슷한 선호도를 가진 사람들끼리 같은 공용장소를 사용하도록 유도하여 시스템 전체로 모든 사람의 만족도를 최대화하는 문제를 고려한다. 예를 들어, 음악, 밝기, 온도에 대한 비슷한 취향을 가진 사람을 같은 사무실또는 같은 시간대의 헬스장을 이용하게 한다면 모든 사람들이 만족도를 최대화하는 공유공간의 환경설정이 가능하다. 

2. 공유환경 설계를 위한 클러스터링 문제

본 장에서는 여러 환경 설정에 대한 개인별 선호도 정보에 따라 전체 사용자 집단을 비슷한 선호도 패턴을 가지는 사람들의 몇 개의 그룹으로 나누는 문제를 고려한다. 이 접근 방법은 [5]에서 고려한 상호 작용 시스템의 여러 대안 중 모든 사용자들을 최대한 만족시키는 대안을 찾는 방법과는 달리 특정 대안에 가장 적합성을 보이는 사용자들로 구성된 그룹을 찾아 같은 공유공간에 배정함으로써 각 그룹별 만족도와 전체 집단의 만족도를 최대화할 수 있다. 

<Figure 2>는 유사 선호도 패턴을 가지는 소그룹을 결정하는 클러스터링 방법이 어떻게 활용될 수 있는지를 보여준다. 휴게실이 여러 개 있는 경우에나 헬스장의 시간대별 사용으로 동일한 여러 개의 공유공간이 존재하게 된다. 이때, 클러스터링 방법에 의해 결정된 소그룹을 시간 또는 공간별로 전체 집단의 만족도를 최대화하도록 배정할 수 있다. 예를 들어, 음악과 실내 온도에 비슷한 선호도를 보이는 사람들을 같은 시간에 공유환경을 사용하도록 배정하던지 아니면 별도의 장소를 제공하는 것을 고려할 수 있다. 실제 실행단계에서는 배정된 공유환경을 개인들이 사용하도록 유도하는 인센티브 구조가 필요하게 된다. 

<Figure 2> Assignment of Shared Environments to Similar Preference User Groups with Time or Space.

3. 선호도 유사성 지표

본 장에서는 주어진 환경 설정에 대한 두 개인의 선호도가 얼마나 같은지를 측정하기 위하여 선호도 유사성(Preference Similarity Index)을 정의한다. 선호도 유사성 지표로는 두 개의 우선순위 리스트간의 거리 측정치를 사용한다. 환경 E에 m개의 대안이 존재한다고 가정하자. 실험자 s와 t에 의한 환경 대안 e의 순위를 Rs(e)와 Rt(e)라고 하고 δs(E)와 δt(E)를 실험자 s와 t에 의한 우선 순위 리스트라고 하자. 이때 두 개의 우선 순위간의 거리는 Spearman’s Footrule[2], Euclidean Distance, Spearman’s rho[10], Kendall’s tau[4], 그리고 확률 거리 모형[3] 등을 이용하여 계산될 수 있다. 이 거리 지표들을 이용하여 두우선 순위 리스트 δs(E)와 δt(E)의 거리 D( δs(E), δt(E))는 다음과 같이 정의된다. 


이렇게 정의된 우선순위 간 거리는 두 개의 우선순위 리스트 즉 두 개인의 선호도가 얼마나 비슷한지를 나타내는 척도로 사용될 수 있고 본 논문에서는 전체 집단을 비슷한 선호도를 가지는 몇 개의 소집단으로 나누는 선형모형의 입력값으로 사용한다. 

4. 클러스터링을 위한 선형 모형(Linear Programming Model for clustering)

본 장에서는 서수(ordinal)로 표현된 개인들의 환경 대안에 대한 선호도 정보를 활용하여 개인 전체 집단을 몇개의 부분 집단으로 나누는 선형모형에 대하여 설명한다. 모든 개인들의 집합을 H라고 Dij는 3장에서 정의된 개인 i와 j의 선호도 유사성 지표라고 약식으로 표현한 것이다. xij는 의사결정변수로써 클러스터 i에 개인 j가 배정되면 1, 아니면 0을 가진다. 특히, i = j일 때 xii가 1이면 i를 중심으로 한 클러스터가 생성됨을 의미한다. 먼저, 선형모형의 목적함수는 (1)과 같이 모든 클러스터 내의 개인 간 선호도 차이의 합이 최소가 되도록 한다. 

 
첫 번째 제약식은 모든 개인이 하나의 클러스터에는 배정되도록 보장하고 식 (2)와 같다.

두 번째 제약식은 필요에 따라 설정되는 클러스터의 개수, K만큼 클러스터가 생성되도록 보장하는 제약식으로 식 (3)과 같다.

세 번째 제약식은 개인 j가 클러스터 i에 배정되기 위해서는 클러스터 i가 이미 생성되어 있어야 함으로 다음의 제약식과 xij는 이진변수라는 조건이 필요하다.

마지막 제약식은 각 클러스터 내에 포함된 개인의 수를 제약하는 제약식이다. 이 제약식은 생성된 각 클러스터에 속한 개인의 수는  보다 작거나 같도록 제한한다. 단, [x]는 실수 x보다 작은 가장 큰 정수이다.

<Table 2> User Preferences for 5 Music Genres.

<Table 3> User Preference Differences by Euclidean Distance.

 
여기에서 식 (4)가 선택적 제약조건인 이유는 생성된 각 클러스터를 공용공간에 할당할 때 인원수의 제약이 존재한다면 이 제약식을 포함하고 그렇지 않은 경우에는 제거하여 더 높은 사용자 만족도를 보이는 클러스터를 구성할 수 있기 때문이다.

앞서 정의한 목적함수와 제약을 가지고 전제 집단을 선호도에 따라 K개의 클러스터로 나누는 선형모형은 다음과 같다.
 

이 선형모형의 결과에 따라 대상이 되는 개인들을 환경의 선호도의 차이가 최소가 되도록 클러스터를 생성하고 이에 따라 개인들이 가장 만족하는 공용환경에 배치함으로써 개인들의 만족도를 최대화할 수 있다. 

5. Numerical Analysis

제 4장에서 제안된 선형모형을 이용한 클러스터링 방법을 설명하고 그 결과를 분석하기 위하여 홍익대학교 산업공학과 대학생 20명을 대상으로 5개의 음악장르에 대한 선호도 조사를 실시하였다. 피 실험자들에게 5개의 음악장르(발라드, 댄스, 랩, 락, 클래식)에 대하여 순위를 매기도록 하여 선호도에 대한 서수정보를 수집하였다. 본 실험에서 사용한 음악 선호도는 다른 선호도 측정 방법에 의한 정보로 대체될 수 있으며 다양한 환경 변수에 대한 선호도 정보로 대체하여 제안된 클러스터링 방법을 적용할 수 있다. 설문조사를 통한 20명 대학생의 선호도는 <Table 2>와 같다. 

<Table 2>의 선호도 결과에 따라 제3장에 제시된 유사성 지표 Euclidean Distance를 활용하여 모든 사용자 조합에 대하여 개인별 선호도 차이를 계산하면 <Table 3>와같다. 이 <Table 3>의 값들은 제3장에서 정의한 Spearman’s footrule, pearman’s rho, Kendall’s tau, Probabilistic Distance등으로 계산된 값으로 대체될 수 있다. 이 <Table 3>의 값들을 식 (5)에 적용하여 다양한 클러스터 개수 (K = 3, 4, 5)에 따라 선형모형을 풀면 <Table 4>와 같은 클러스터링 결과를 얻을 수 있다. 이렇게 얻어진 클러스터는 유사 선호도를 가지는 개인들로 구성되어 개인들의 만족도를 최대화하기 위한 특정 공유 환경 설정이 가능해 진다. 만족도 계산은 [5]에서 제안된 정규화 없는 단순 가산법을 활용한다. 예를 들어, <Table 4>의 장르 1에 대한 개인 A, I, K, L, P, T로 구성된 클러스터의 만족도는 5+4+5+5+3+4 = 26이 된다. 이에 따라 클러스터 내 사용자들의 최대 만족도를 보이는 대안을 구하면 <Table 4>의 마지막 열과같다. 이 의사결정은 구성된 클러스터에 환경설정을 하는 하나의 예로 어플리케이션에 따라 다르게 활용될 수 있다. 또한, K = 3의 경우 클러스터 1과 2가 장르 1에 대해 구성원들의 만족도가 가장 높은 것으로 동일한 결과를 나타났는데 이는 두 클러스터가 하나의 공용환경을 사용할 수 있음을 의미하지는 않는다. 현재 결정된 환경설정이 공용 환경설정 장치의 고장으로 특정 환경설정을 일시적으로 사용할 수 없게 되거나 비용 등의 이유로 특정 환경설정의 사용제약이 생길 경우 비슷한 선호도를 보이는 사용자로 구성된 클러스터 유지 것이 구성원 만족도 감소를 최소화하는 방안이 된다. 

<Table 4> Clustering by LP model.

<Table 5> Averages and Standard Deviations of User Satisfactions with Random and our Method.

마지막으로 제안된 방법의 효과를 보이기 위하여 임의의 사용자로 구성된 클러스터를 생성하여 그에 대한 공용환경 사용자의 만족도와 비교한다. 임의의 사용자로 구성된 클러스터와 비교하는 이유는 공용환경 운영자 측이 사용자들의 구성에 관여하지 않으면 사용자들은 임의로 공용환경을 사용하게 되므로 이 경우와 제안하는 방안의 비교가 적절하다고 판단하였다. <Table 5>는 각 클러스터링 방법에 따른 사용자들의 만족도 평균과 표준편차를 보여준다. 클러스터 개수에 상관없이 본 연구에서 제안하는방법의 사용자 만족도가 높고 사용자들 간의 만족도 차이가 적어 보다 좋은 결과를 보이고 있다. 특히, 표준편차가 적다는 것은 평균 만족도를 높이기 위해 임의의 환경변수를 선택함으로써 해당 공용공간에 존재하는 어떤 개인의 만족도가 희생될 가능성이 낮음을 의미한다. 

6. 결 론

유비쿼터스 기술의 발전에 따라 미래에는 인간의 선호도에 따라 환경 변수의 설정이 자동으로 변화하는 지능형 환경이 보편화될 것으로 예상된다. 따라서, 유비쿼터스 공용 환경 내에 존재하는 서로 다른 선호도를 가진 개인들의 만족도를 최대화하는 환경 설정을 위한 의사결정 시스템 개발에 대한 연구가 진행되고 있다. 이와는 반대로 비슷한 선호도를 가지는 개인들끼리 같은 공간 또는 시간에 공용환경을 사용하게 하여 개인들의 만족도를 최대화하는 방법도 있을 수 있다. 이를 위하여 선호도 정보를 바탕으로 비슷한 선호도를 보이는 그룹을 생성하는 클러스터링 방법이 필요하다. 

본 연구에서는 공유환경을 공간 또는 시간에 따라 구분할 수 있을 경우, 그 공유환경에 가능한 비슷한 환경 선호도를 가지는 개인을 배정하여 공유환경을 사용하는 개인들의 만족도를 최대화하기 위하여 유사 선호도를 가지는 클러스터링을 하는 방법을 제안한다. 먼저, 주어진 두 개인의 선호도가 얼마나 비슷한지 평가하기 위하여 선호도 유사성 지표를 제안하였다. 이 유사성 지표를 활용하여 두 개인간의 선호도 거리를 계산하여 전체 개인들 간의 선호도 차이를 나타내는 행렬을 구한다. 이 선호도 차이 행렬을 가지고 같은 그룹 내에 속한 개인들의 선호도 차이가 최소가 되도록 클러스터링을 만드는 선형모형을 제안하였다. 이 선형 모형의 결과에 따라 비슷한 선호도 패턴을 가지는 개인들의 그룹을 찾을 수 있고 이를 비슷한 환경 변수 설정을 가지는 공간에 배정하여 개인들의 만족도를 최대화 할 수 있다. 

그러나 이러한 클러스터링 결과에 따라 각 클러스터별로 독립된 공용환경을 할당하고 각 공용환경에 환경변수를 어떻게 설정하는 지에 대한 많은 이슈가 존재할 수 있다. 제5장에서는 사용자 만족도를 최대화하는 환경변수 설정을 예로 제시하였으나 공용환경 설정 장치의 고장으로 특정 환경설정을 일시적으로 사용할 수 없게 되거나 비용등의 이유로 특정 환경설정의 사용제약이 생겨 여러 개의 환경설정을 혼용해야 하는 경우에는 다른 의사결정이 필요하다. 이와 같은 다양한 상황을 고려해야 하는 경우에는 비슷한 선호도를 보이는 사용자로 구성된 클러스터를 유지하는 것이 구성원 만족도 감소를 최소화하는 방안이 될것으로 예상된다. 즉, 선호도 전체 정보를 기반으로 한 유사사용자 그룹을 선정하는 것이 가장 선호하는 대안에 따라 그룹을 선정하는 경우보다 불확실한 상황에 대한 Robust한 클러스터링 방안이라고 할 수 있다. 향후 연구에서 이 문제에 대한 보다 심도 있는 분석을 실시할 예정이다. 

Acknowledgement

This research was supported by Basic Science Research Program through the National Research Foundation of Korea(NRF) funded by the Ministry of Education, Science and Technology(2011C104701). 

36-1-09 손기혁 옥창수64-69.pdf493.0KB

Reference

1.Baek, D. and Jin, H., A Feasibility Study on the Location Based Services under Ubiquitous Environment. Journal of the Society of Korea Industrial and Systems Engineering, 2007, Vol. 30, No. 3, p 1-11.
2.Diaconis, P. and Graham, R.L., Spearmanʼs footrule as a measure of disarray. Journal of the Royal Statistical Society, Series B (Methodological), 1977, Vol. 39, No. 2, p 262-268.
3.Ha, V. and Haddawy, P., Toward Case-Based Preference Elicitation: Similarity Measure on Preference Structures. Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, Madiason, WI 1998, p 193-201.
4.Kendall, M.G. and Gibbons, J.D., Rank Correlation Methods(5th ed). New York : Oxford University Press, 1990.
5.Lee, S. and Ok, C.-S., Group Preference Aggregate Functions Based on Social Welfare : Beyond Sum of Satisfactions, 2013, Information Sciences, Under revision.
6.Masthoff, J., The Pursuit of Satisfaction : Affective State in Group Recommender Systems. LNAI 3538, 2005, Vol. 3538, p 297-306.
7.McCarthy, J.F. and Anagnost, T.D., MusicFX : An arbiter of group preferences for computer supported collaborative workouts. Proc. ACM 1998 Conference on Computer Supported Cooperative Work, 1998, p 363-372.
8.Nam, J., Kim, H., Shin, D., Park, J., and Hur, S., A Formal Model of Coordination for Supporting Community Computing in a Ubiquitous Environment. Journal of the Society of Korea Industrial and Systems Engineering, 2008, Vol. 31, No. 3, p 43-51.
9.Ok, C.-S., Lee, S., and Jeong, B., Toward socially agreeable aggregate functions for group recommender systems. The Korean Operations Research and Management Science Society, 2007, Vol. 32, No. 4, p 61-75.
10.Rohatgi, V.K., An Introduction to Probability Theory and Mathematical Statistics. John Wiley and Sons, 1796.
11.Russell, D., Streitz, N., and Winograd, T., Building disappearing computers. Communications of the ACM. 2005, Vol. 48, No. 3, p 42-48.
12.Tandler, P., Streitz, N., and Prante, T., Roomware- Moving toward ubiquitous computers. IEEE Micro, 2002, Vol. 22, No. 6, p 36-47.
13.Weiser, M., The computer for the 21st century. Scientific American, 1991, Vol. 265, No. 3, p 94-104.