1서 론
서버 고장(server failure)을 고려한 G/G/m 대기행렬 모 형은 오랜 시간동안 생산 공정을 비롯한 다양한 시스템의 성능척도를 추정하는데 사용되어 왔다. 단일 서버로 구성 된 모형에 관하여는 내재점 마코프체인(embedded Markov chain)이나 부가변수법(supplementary variable method) 등 다양한 방법을 통하여 평균 체제시간(mean sojourn time) 과 같은 성능척도에 관한 정확한 해를 구하는 방법이 제 시되어 있으나, 복수 서버 시스템의 경우 마코비안 대기 행렬 시스템[10]을 제외하면 정확한 평균 체제시간을 구 하는 방법은 현재까지 알려진 바가 없다. 이론적으로는 부가변수법과 같은 방법을 통하여 분석할 수 있지만 서 버의 수가 증가함에 따라 상태(state)의 수도 지수적으로 증가하기 때문에 정확한 해(exact solution)를 산출해내기 쉽지 않다. 그렇기 때문에 복수 서버로 구성된 시스템의 경우 근사(approximation) 해법을 통하여 주로 시스템의 성능척도들을 산출하게 된다. 보다 복잡한 시스템의 경우 시뮬레이션을 이용하여 성능을 평가하는 경우도 많다[6]. 많은 근사해법들이 서버 고장을 고려한 대기행렬 모형의 평균 체제시간을 분석하기 위해 제시되었고, 이러한 근 사해법들은 평균 체제시간에 관한 근사해를 제공함과 동 시에 시스템을 직관적으로 이해하는데 유용한 정보를 제 공한다[4, 12]. 하지만 근사해법을 이용하면 필연적으로 오차가 발생할 수밖에 없는데, 이에 대한 예제가 <Figure 1>에 제시되어 있다. <Figure 1>은 서버 고장을 고려한 M/M/1 대기행렬 모형에 대해 체제시간을 두 가지 방법 으로 구하여 비교한 것이다. ‘Exact’는 정확한 해의 값이 며, ‘Approximated’는 Hopp and Spearman[4]이 제시한 근 사법으로 얻은 결과이다. 상대오차를(정확한 체제시간 값 –근사해법을 통해 계산된 체제시간 값) ÷ (정확한 체제 시간 값)로 정의하고 <Figure 1>에서 점선으로 표시하였 다. 상대오차는 교통밀도가 높아지면서 감소하는 것을 볼 수 있다. 생략된 0.9 이상의 교통밀도 수준에서는 상대오 차가 5% 미만이었다. 하지만, 0.2 이하의 낮은 교통밀도 에서는 30% 이상의 큰 오차를 보인다. 이는 대부분의 생 산 공정에서 경제적인 이유 등으로 높은 서버 이용률을 목표로 시스템을 운용하기 때문에 근사해법들이 높은 교 통밀도(heavy traffic)에 초점을 두고 개발되었기 때문이다. 그럼에도 불구하고 복잡하게 구성된 생산 시스템에는 적 지 않은 공정들이 낮은 교통 밀도 하에서 운영되고 있으 며 이러한 공정들의 체제시간 또한 시스템 전체의 성능척 도에 영향을 미치게 된다. 특히, 낮은 교통 밀도 하에서 운영된다고 하더라도 서버 고장이나 셋업(setup)과 같은 사건들로 인해 추가적으로 시스템에서 지체가 발생하게 되므로 전체 시스템의 성능척도를 산출하기 위해서는 이 러한 공정들의 체제시간 또한 분석되어야 한다.
본 논문에서 분석하는 고장이 발생하는 낮은 교통밀 도의 시스템은 반도체 제조공정에서 찾아볼 수 있다. 먼 저 병목 공정이 있는 시스템의 예를 들 수 있다. 서버 고 장이나 셋업 등 서비스 시간 외에 지체(delay)를 일으키 는 사건들이 발생하지 않는, 공정들이 직렬로 연결된 시 스템의 지체시간 분석을 가정하자. Avi-itzhak[1]의 결과 에 의하면 서비스 시간이 확정적인 시간을 갖는 직렬 대 기행렬(tandem queue) 모형의 경우 병목 공정 후에서는 지체가 발생하지 않으며, 따라서 자재(lot 또는 WIP)의 지체시간을 분석할 때는 병목 공정 후의 공정들은 고려 하지 않는다. 즉, 병목공정의 후속 공정들에서 자재들이 머무는 시간은 각 공정의 서비스 시간의 합으로 표현된 다. 또한, 자재들이 직렬 대기행렬 모형에서의 총 지체 시간은 병목현상을 서비스 시간으로 갖는 단일서버 대기 행렬 모형의 지체시간과 같음을 증명하였다. 여기서 지 체가 없는 후속 공정은 본 연구의 대상이 되는 낮은 교 통밀도를 갖는 공정으로 간주할 수 있을 것이다. 이 결과 를 바탕으로, Morrison[11]과 Kim and Morrison[8]은 확 정적인 서비스 시간을 갖는 직렬 대기행렬 모형을 통하 여 반도체 제조라인 내 클러스터 장비의 지체 시간을 분 석하였다. 위 논문들은 공통적으로 시스템의 서버 고장 과 같은 사건을 고려하지 않으며, 따라서 병목 공정의 후 속 공정에서는 지체가 발생하지 않는다고 가정하고 있 다. 이러한 가정 때문에 병목 공정 후 공정들은 일반적으 로 소수의 서버로 운영되지만 서버 고장과 같은 사건들 에 의해 병목현상 후 낮은 교통밀도 하에서 운영되는 공 정에서도 지체가 생길 수 있으며, 이는 시스템 전체의 체 제시간에 영향을 미친다. 또 다른 낮은 교통밀도를 갖는 시스템의 예는 셋업이 필요한 반도체 클러스터 장비에서 도 찾아볼 수 있다. 반도체 공정의 경우 생산 중 제품의 종류가 바뀌는 경우 클러스터 장비의 셋업이 필요한데 장비 셋업을 위해서는 셋업이 필요한 공정을 포함한 선 행 공정에 웨이퍼가 존재하지 않아야만 한다[9]. 이 경우 같은 lot 타입 의 연속된 lot들을 하나의 고객으로 간주하 면, 클러스터 장비는 셋업 과정으로 인하여 낮은 교통밀 도 하에서 운영됨을 알 수 있다.
기존에 제시된 분석 방법들과 한계를 살펴보자. 서버 고장을 고려한 대기행렬 시스템의 초기 연구로 White and Christie[13]의 것을 찾아볼 수 있다. 서버 고장을 고려한 M/G/1 대기행렬 모형의 성능척도에 관하여는 Avi-Itzhak and Naor[2], 그리고 Gaver[3]에 의해 분석되어 있다. 위 논 문들에서는 서버 고장은 포아송 과정Poisson process)으 로 일어나며, 수리 기간은 일반 분포를 따른다고 가정한다. 고객의 도착과정이 복합(compound) 포아송 과정을 따르 고 서비스 시간은 얼랑 분포를 따르는, 서버 고장이 발 생하는 대기행렬 모형에 대해서는 Kim and Kang[5]에 의 해 분석되었다. 복수 서버 시스템에 대하여는 고장과정과 수리과정이 포아송 분포를 따르는 M/M/m대기행렬 모형 에 관한 안정상태 고객 수 분포를 Mitrany and Avi-Itzhak [10]이 제시하였다. 그러나 서버 고장을 고려한 G/G/m대기행렬 모형에 대하여는 평균 체제시간에 관한 해를 정 확히 구하는 방법이 제시된 바가 없다. 서버 고장을 고려한 G/G/m대기행렬 모형의 분석은 대부분 근사해법에 의존 하고 있는데 현재 쓰이는 근사해법들은 Hopp and Spearman [4]과 Whitt[14]에 의해 개발되었다. Morrison and Martin [12]에 의해 확장된 Whitt[14]의 결과는 IBM 반도체 생산 공정을 분석하는데 사용되었다. 이 근사해법들은 높은 교 통밀도에서는 만족할만한 결과를 제공하지만 낮은 교통밀 도에서는 상대적으로 큰 오차를 보이고 있다. 마지막으로 본 연구의 초기 결과들은 Kim and Morrison[7]에 제시되 어 있다.
위의 사례들과 기존 연구들을 볼 때 낮은 교통밀도 하에서 서버 고장을 고려한 복수 서버 대기행렬 모형의 분석의 필요성을 찾아 볼 수 있다. 본 논문에서는 0에 가까운 낮은 교통밀도 하에서 근사해가 아닌 정확한 평 균 체제시간을 분석한다. 본 논문의 결과를 이용하여 시스템의 특성을 정확하게 파악할 수 있으며 부수적인 효과도 기대할 수 있다. 이는 정확한 해를 제시하므로 추후 새롭게 개발된 근사해법을 검증하는데 사용될 수 있다는 점이다. 또한 본 논문에서는 새로운 분석방법을 제시하는데, 서비스 시간이 단계형 확률 변수를 따르는 대기행렬 모형들과 집단 도착 대기행렬 모형들을 2차원 의 전이율 다이어그램 (transition rate diagram)을 갖는 마코프 체인 모형으로 분석하는 방법이다. 또한 비병목 공정의 체제시간에 관한 분석에 적용하는 방법들이 추 가되었다.
본 논문은 다음과 같이 구성된다. 제 2장에서는 먼저 모형을 수학적으로 정의한다. 고객들의 도착간은 일반분 포를, 서비스 시간은 지수분포를 갖는 대기행렬 시스템과 단계형 확률변수인 시스템이 낮은 교통밀도 하에서 흡수 마코프 체인으로 분석될 수 있음을 보이고 평균 체제시 간을 분석한다. 동일한 방법으로 고객 집단 도착 시스템 도 분석할 수 있음을 보인다. 제 3장에서는 제 2장의 결 과를 이용하여 고객들의 도착간격과 서비스 시간 모두 일반분포를 따르는 대기행렬 모형의 평균 체제시간을 재생 이론을 이용하여 분석한다. 제 4장에서는 본 논문 의 결과를 사용하여 기존의 근사해법들을 검증해본다. 제 5장에서는 본 연구의 결과와 방법에 대한 의의를 논 의한다.
2서비스 시간이 단계형 확률변수를 따르는 대기행렬 모형 분석
본 장에서는 논문의 모형을 수학적으로 정의하고 낮은 교통밀도 하에서 서버고장을 고려한 G/M/m 대기행렬 모형의 평균 체제시간을 분석한다. 서버 고장을 고려한 M/M/m대기행렬 모형의 평균 체제시간에 관한 결과는 Mitrany and Avi-Itzhak[10]에 의해 분석되었지만, 그 방 법은 도착간격과 서비스 시간의 분포가 지수분포일 때만 적용 가능하다. 본 논문에서는 흡수 마코프체인을 통하 여 평균 체제시간을 분석하는 새로운 방법을 제시한다. 동일한 방법으로 서비스 시간이 단계형 확률변수를 따르 는 대기행렬 모형 또한 분석할 수 있다.
주요 가정들은 다음과 같다. 먼저, 대기행렬 모형의 교 통밀도가 0에 가깝다. 교통밀도가 낮기 때문에 임의의 고객이 시스템에 도착했을 때 시스템 안에는 다른 고객 은 존재하지 않는다고 가정한다. 따라서 고객의 지체는 서버 고장으로 인해서만 발생한다. 각각의 서버에서는 고장이 발생해 서비스가 불가한 상태(고장 상태, failure period)와 서비스가 가능한 상태(운영 상태, available period) 가 반복적으로 번갈아가며 일어나는데, 이를 각각의 기간에 머무는 시간이 지수분포를 따르는 교대 재생과정 (alternating renewal process)으로 가정한다. 서버가 고장 나서 수리 후에 고객의 서비스가 처음부터 반복되는지 여부에 따라 축출-계속형(preemptive-resume) 시스템과 축 출-반복형(preemptive-repeat) 시스템으로 나뉘는데 본 논 문에서는 축출-계속형 시스템을 가정한다. 축출-계속형 시스템에서는 서버 고장에 의해 중단되기 전까지 받은 고객의 서비스의 양은 유효하며 수리 후 재개되는 서비 스는 축출 시점부터 계속된다. 축출 반복형은 서비스가 서버 고장에 의해 중단되면, 그때까지 받은 고객의 서비 스는 무효로 간주한다. 서비스 시간이 지수분포를 따를 때에는 지수분포의 무기억 속성(memoryless property)에 의해 두 시스템은 동일한 행태를 보이기 때문에 G/M/m 모형을 다루는 본 장에서는 축출-계속형과 축출-반복형 으로 구분하는 것이 수학적으로는 무의미하다. 그러나 다음 장에서는 서비스 시간이 일반분포를 따르는 모형을 다루는데 이 모형에서는 축출-계속형과 축출-반복형의 수학적 분석에 차이가 발생한다. 또 다른 가정으로, 임의 의 고객이 서비스 도중 서비스 받고 있던 서버의 고장이 발생할 경우 다른 서버로 즉시 이동하여 서비스를 계속 하여 받으며 이동시간은 무시한다. 만약 모든 서버가 고 장 상태가 된다면 고객은 서버 중 하나가 수리될 때까지 기다리게 되며 이전까지 받았던 서비스는 유효하다. 이 전에 언급했다시피 교통밀도가 0에 가깝기 때문에 서버 고장에 의한 대기시간의 발생을 제외하고는 다른 대기시 간은 발생하지 않는다. 이제 본 논문에서 사용되는 모형 의 매개변수(parameter)들을 정의한다. 각 서버의 서비스 율(service rate), 고장율(failure rate)과 수리율(repair rate) 을 각각 μ, ξ와 η로 정의한다. 각 서버는 고장 상태와 가 동상태가 교대로 반복되는데 가동 기간과 수리기간은 각 각 위에 정의된 고장율과 수리율을 갖는 지수분포를 따 르며 서로 독립이라고 가정한다.
위와 같은 가정들을 바탕으로 시스템을 흡수 마코프 체인 모형(absorbing markov chain)을 이용하여 모델링한다. 안정상태(steady-state)에서 도착하는 임의의 고객은 교통 밀도가 0에 가까울 때, 다른 고객이 아무도 없는 상태의 시스템에 도착하게 되는데, 도착하는 고객이 보게 되는 가용한(고장나지 않은) 서버의 수를 나타내는 확률변수 를 N 이라고 정의한다(). 시스템이 안정 상태에 있고 서버 고장과 수리 과정이 독립이므로, N은 식 (1)과 같은 이항분포(binomial distribution)을 따르게 된다. 이에 관한 엄밀한 수학적인 증명은 Avi-Itzhak[1]에 제시되어 있다.
마코프 체인 모형의 각 상태 을 가용한 서 버의 수로 가정하면, <Figure 2>와 같은 전이율 다이어그램 을 갖는 연속시간 시간동질(continuous-time homogeneous) 마코프 체인 모형을 얻을 수 있다. 상태 n에 있을 때 상태 n + 1로의 전이율(transition rate)은 (m - n)η이며, 상태 n - 1로의 전이율은 nξ이다(n이 0이나 m일 경우는 제외한 다). 상태 SC는 서비스의 완료(service completion)를 나타 내는 흡수 상태이다. 가용한 서버가 1개 이상이라면, 각 상태에서 μ의 전이율로 흡수 상태(absorbing state)로 전이 가 이루어지게 되며, 이는 서비스가 완료되었음을 의미한 다. 따라서, 마코프 체인에서 흡수 상태로 전이가 이루어 질 때까지 걸리는 시간은 고객의 평균 체제 시간과 동일 한데, 이는 낮은 교통밀도를 갖는다는 특수한 가정 때문 이다. 상태들을 의 순서로 배열 하면 다 음과 같은 전이율 행렬 Q를 얻을 수 있으며 행렬 Q를 다 음과 같이 분할한다. 이 때, 행렬 Θi,j는 모든 원소가 0이 며 크기가 i × j인 행렬이다.
행렬 T 와 T0를 구성한 결과가 제시되어 있다. T 와 T0는 크기가 각각 (m + 1) × (m + 1)과 (m + 1) × 1인 행렬이다. 행렬 T 는 상태 SC를 제외한 일시 상태(transient state)들 간의 전이율을 나타내는 행렬이다. 이 때, 확률변수 Y를 흡수상태로 전이될 때 까지 걸리는 시간이라고 정의하고 Y의 확률밀도함수와 라플라스 변환을 각각 f(y)와 로 정의하면 흡수 마코프 체인 모형에 관한 기존의 결과를 이용하여 다음과 같은 결과를 얻을 수 있다.
A는 (m + 1)개의 원소로 구성된 행 벡터이며, 마코프체 인의 초기확률상태를 나타낸다. e는 모든 원소를 1로 갖는 열벡터이다. 확률 변수 Y가 마코프체인이 흡수 상태로 전 이될 때까지 걸리는 시간을 나타내므로, E(Y)는 낮은 교 통밀도 하에서 고객의 평균 체제시간을 의미한다. 예를 들어, 서버가 두 개인 경우, T 와 A는 다음과 같다.
식 (2)을 통하여 구한 고객의 평균 체제 시간은 식 (3) 과 같다.
식 (3)을 해석하면 우리는 시스템의 행태를 이해할 수 있 다. 식 (3)번의 마지막 수식의 첫 번째 항은 서비스 시간 을 나타낸다. 두 번째 항은 임의의 고객이 도착했을 때 모 든 서버가 고장상태임을 나타낸다. 의 확률로 고객이 도착했을 때 두 서버 모두 고장 상태이고, 이 때 고객은 두 서버 중 하나의 수리가 완료될 때까지 기다려 야 하며 평균적으로 (1/2η)시간만큼 기다리게 된다. 세 번째 항은 고객이 서비스를 받는 도중 모든 서버에 고장 이 발생해 수리될 때까지 지체되는 시간을 나타낸다.
위와 같은 분석법은 서비스 시간의 분포가 지수분포 일 때 뿐 아니라, 지수분포들로 구성되는 단계형 확률변 수에도 적용 가능하다. 서비스 시간이 단계형 확률변수 를 따를 때에는 상태가 2차원 형태로 구성된다. 예를 들 어, 서비스 시간이 얼랑 분포(Erlang (n, μ) )를 따르는 대기 행렬의 모형의 경우 가용한 서버 수를 i로, 잔여 서비스 단계를 j로 나타내자. 상태 (i, j)에 대한 전이율 다이어 그램은 <Figure 3>과 같다. 일시 상태들을 과 같이 배열하면 일시 상태 간의 전이율을 나타내는 행렬 T 는 다음과 같다.
단, C1과 C0는 다음과 같이 정의된다.
위 전이율 행렬 T 와 식 (2)의 결과를 이용하면 시스템 의 성능척도들을 계산할 수 있다. 초기 상태 확률 벡터 A는 상태 (i, n)에 해당하는 원소들만 확률값을 가지며 그 값은 αi이다.
이러한 분석 방법은 고객이 집단으로 도착하는 대기행 렬 모형에도 적용될 수 있다. 고객이 집단으로 도착하며 집단 크기는 범위가 1부터 B 까지의 값을 갖는 이산 확률 변수(discrete random variable) X를 따른다고 가정하자. 각 고객의 서비스 시간은 서비스율이 μ인 지수분포를 따 른다. 확률변수 X의 확률 질량 함수(probability mass func tion)를 라고 정의하면, 전이율 다이어그램은 <Figure 4>와 같다(단, B > m). 상태 (i, j) 의 원소는 각각 가용한 서버의 수와 도착한 집단의 크기 를 나타낸다. 예를 들어, 상태 (m - 1, B), 는 크기 B 인 집 단이 도착했을 때, 가용한 서버의 수는 m - 1임을 나타낸 다. 이 경우 도착한 고객 중에 m - 1명의 고객이 도착 즉 시 가용한 서버에서 서비스를 받게 되며 시스템의 서비스 율은 (m - 1)μ이다. 비슷한 방식으로 일시 상태간의 전이 율 행렬을 구한 후 식 (2)를 이용하면 평균체제시간을 구 할 수 있다. 상태 (i, j)에 대한 초기상태 확률은 αi와 bj 의 곱이다. 이와 같이 단계형 확률 변수 뿐 아니라 집단 도착 대기행렬 모형의 경우에도 흡수 마코프 체인을 이용 하여 체제시간을 구할 수 있다.
3서비스 시간이 일반 분포를 따른 대기행렬 모형 분석
이번 장에서는 낮은 교통 밀도 하에서 서비스 시간이 일반 분포를 따르는 서버 고장을 고려한 G/G/m 모형을 분석한다. 제 2장에서와 동일하게 서버의 가용기간과 고 장기간은 지수분포를 따른다고 가정하면 마코프 체인 모 형과 재생 이론 (renewal theory)을 이용하여 대기행렬 모 형의 체제시간의 정확한 값을 구할 수 있다. 서비스 시간 의 분포가 일반분포를 따르기 때문에 서비스 시간을 나타 내는 확률 변수를 S 로, 이의 확률밀도함수를 fs(t)로 정 의하자. 제 2장의 식 (3)을 관찰해 보면, 낮은 교통 밀도 하에서 체제시간은 세 가지 항들의 합으로 구성된다. 첫 번째로, 고객은 서비스 시간만큼 시스템에 머무르게 된다. 두 번째로, 고객이 시스템에 도착했을 때 모든 서버가 고 장 상태일 경우, 고객은 서버가 수리될 때까지 기다린다. 세 번째로, 고객이 서비스 받는 도중 모든 서버의 고장이 발생하면 고객은 서버가 수리될 때까지 기다리게 된다. 모든 서버 중 하나의 서버가 수리 되는 즉시 고객은 수리 가 완료된 서버로 이동하여 즉시 서비스를 이어서 받는 것을 참고하자. 확률 변수 B 를 고객의 서비스 시간 동안 모든 서버가 동시에 고장 상태에 있게 되는 사건 수로 정 의하면 평균 체제시간은 다음과 같은 식 (4)로 표현될 수 있다.
식 (4)에서 E[B]를 제외한 모든 항들은 시스템 파라미 터로 주어져 있기 때문에 E[B]를 구하면 평균 체제시간 을 구할 수 있다. 우리는 두 단계를 이용하여 E[B]를 구 할 수 있다. 먼저, 흡수 마코프 체인 모형을 이용하여 고 객의 서비스 도중 모든 서버가 고장 날 때까지 걸리는 평균 시간을 계산한다. 그 후에, 모든 서버가 고장 나는 사건의 수를 재생 이론을 이용하여 계산하면 E[B]를 구 할 수 있다.
먼저, 흡수 마코프 체인 모형을 이용하여 모든 서버가 고장 날 때까지 걸리는 시간을 계산한다. 마코프 체인의 상태를 안정상태에서 가용한 서버 숫자로 정의하면 마코 프 체인은 <Figure 5>와 같다.
상태 0과 상태 m을 제외하면 상태 n에서 상태 n + 1 로의 전이율은 (m - n)η이고 상태 n - 1로의 전이율은 nξ 이다. 흡수 상태 0은 모든 서버가 고장인 상태를 의미한 다. 이 때, 마코프 체인이 흡수 상태로 전이될 때까지 걸 리는 시간은 모든 서버가 고장상태로 전이될 때까지 걸 리는 시간이다. 상태들을 {1, 2, …, m, 0}과 같이 재배열 하면 일시 상태간의 전이율을 나타내는 행렬 T 는 식 (5) 와 같다.
식 (2)를 통하여 흡수할 때까지 걸리는 시간의 확률 밀도 함수와 라플라스 변환, 그리고 평균을 구할 수 있는데, 흡수 할 때 까지 걸리는 시간이 체제 시간이었던 제 2장 과는 달리, 위 모형의 흡수할 때까지 걸리는 시간은 서비 스 도중 모든 서버가 고장 상태가 될 때까지 걸리는 시 간을 나타낸다. 초기확률을 나타내는 벡터 A는 ()이다. 벡터 A의 첫 번째 항이 α0 + α1인 이 유는 고객이 도착시점에 모든 서버가 고장 상태일 경우 에는 서버가 수리 될 때까지 걸리는 시간이 식 (4)의 두 번째 항에 반영되어 있고, 수리 후에는 가용한 서버 수가 하나인 상태에서 서비스를 시작하기 때문이다. 위 마코 프 체인이 흡수 상태로 전이될 때까지 걸리는 시간을 재 생이론의 재생간격으로 보고, 시간 t까지 발생한 재생 사 건의 수를 N(t)로 정의하자. E[B]는 서비스 시간동안 모 든 서버에 일어나는 평균 횟수를 나타내므로 서비스 시 간에 조건을 취하면 다음과 같이 E[B]의 값을 얻을 수 있다.
식 (6)에서 볼 수 있듯이, E [N(t)]의 값을 계산하면 E[B]의 값을 구할 수 있다. E [N(t)]의 라플라스 변환을 로 정의하면 재생 이론을 통하여 다음의 식 (7) 같은 결과를 얻는다.
초기확률 벡터는 각각 다음과 같다.
이는 처음에 고객이 서버에 도착하게 될 때 보게 되는 가용한 서버 수는 이항분포를 따르지만, 그 후 서비스 도 중 모든 서버에 고장이 일어나게 될 경우, 수리 완료가 될 때는 항상 하나의 서버만 가용한 상태가 되기 때문이 다. 식 (7)의 라플라스 변환에 역변환을 취하여 식 (6)에 대입한 뒤 적분을 계산하면 평균 체제 시간을 구할 수 있다.
위 방법을 이용하여 대기행렬 모형의 체제시간을 구 해보자. M/M/2 대기행렬 모형의 체제시간에 관한 결과 는 식 (3)에 제시되어 있지만, 위 방식으로도 동일한 결 과를 얻음을 확인할 수 있다. 전이율 행렬 T와 초기확률 벡터들은 식 (9)와 같다.
식 (7)로부터 와 를 구하면 다음과 같다.
위 식을 (7)을 대입하여, 를 구하면 다음과 같다.
역변환을 취하고 식 (6)에 대입하면 E[B]를 구할 수 있다.
위에서 구한 값을 식 (4)에 대입하면 식 (3)과 일치하는 것을 확인할 수 있다.
4응용 사례
본 장에서는 앞의 장에서 구한 방법론들이 실제 생산 공정에서 어떻게 적용될 수 있는지 방법들을 제시하고자 한다.
4.1비병목 공정의 체제시간에 관한 분석
본 논문의 방법론이 교통밀도가 0에 가까이 낮은 상황 에서의 체제시간에 관한 결과라는 것에서 착안하면, 복 잡한 생산 시스템의 비병목 공정들의 체제시간에 관한 유용한 정보를 제공하는 데 사용될 수 있다. 대부분의 생 산 공정의 경우 병목 공정 후에 있는 공정들은 적은 수 의 서버들로 운영되고 있다. 하지만 고장이나 셋업과 같 은 사건들이 자주 일어나는 상황에서 적은 수의 서버로 공정을 운영할 경우, 체제시간이 길어지게 되므로 이러 한 상황을 분석하여 적절한 수의 서버를 배치하는 것이 필요하다. 수치 예제를 통하여 우리는 서버 수가 증가함 에 따라 체제시간이 어떻게 감소하는지 살펴볼 수 있다. <Table 1>에서 서비스 시간이 지수분포일 때 다양한 고 장율에 따른 체제시간이 계산되어 있다. 고장율이 증가 함에 따라 체제시간 또한 증가하는 것은 자명하나, 우리 는 어느 정도 체제시간이 증가하는지를 분석함으로서 시 스템에 관한 유용한 정보를 얻을 수 있다. 먼저, 서비스 율(μ)이 5이기 때문에, 서버 고장을 무시하면 체제 시간 이 0.2의 값을 갖게 됨을 참고하자. 서버 고장이 발생하 고 발생율이 1이 될 경우, <Table 1>에 따르면 고장의 영 향을 받지 않기 위해서는(고장이 없는 시스템과 같은 성 능을 내기 위해서는) 시스템의 서버 수가 3대 이상이어 야 한다. 마찬가지로, 만일 서버 3대로 운영되고 있는 시 스템에서 고장율이 1에서 5로 다섯 배가 증가한다면, 비 슷한 성능을 얻기 위해서 서버 4대를 더 설치해야 함을 의미한다. 이와 같은 분석을 통하여, 비병목 공정에서의 서버의 대수를 산정하는데 유용한 정보를 얻을 수 있다.
4.2근사해법의 이론적 검증
앞의 장에서 구한 방법이 정확한 해임을 참고하자. 정 확한 해를 이용하여 체제시간에 관한 근사해법들을 이론 적으로 테스트할 수 있다. 이 장에서는 본 논문의 결과를 이용하여 Hopp and Spearman[4]와 Kim and Morrison[9] 의 서버고장을 고려한 G/G/m 대기행렬 모형의 체제시간 에 관한 근사해법들을 테스트한다. 위 두 논문에 제시된 근사해법 식은 각각 식 (13)과 식 (14)와 같다.
각각의 근사해법 식의 변수들은 Hopp and Spearman[4] 와 Morrison and Martin[12]의 정의를 따른다.
위 식에서, 교통밀도가 0에 가까워지면 낮은 교통밀도 하에서 체제시간에 관한 근사해를 구할 수 있다. 결과가 <Figure 6>에 제시되어 있다. X축은 고장율을 수리율로 나눈 상대적 고장율로서 수리하여 서비스가 가능한 상태에 비해 상대적으로 고장이 얼마나 자주 발생하는지를 나타 낸다. 그림에서 확인할 수 있듯이 식 (14)를 통하여 얻은 근사해가 식 (13)의 결과보다 더 정확한 해를 제공함을 확인할 수 있다. 이와 같이, 제시된 방법은 근사해법의 정확도를 이론적으로 시험하는 데에 사용될 수 있다.
5결 론
G/G/m 대기행렬 모형에 관한 많은 연구결과들이 있 지만 아직까지 체제시간에 관한 정확한 해를 구하는 방 법은 제시되지 않았다. 그렇기 때문에, G/G/m 대기행렬 을 분석할 때에 대부분의 경우 근사해법을 사용하게 된 다. 근사해법들은 시스템에 관한 유용하고 직관적인 정 보를 제공하지만 근사해법을 검증하는 것은 쉽지가 않 기 때문에 대부분의 경우 시뮬레이션이나 하나의 서버 로 이루어진 마코비안 대기행렬 모형과 같은 모형들을 이용해 왔다.
본 논문에서는 낮은 교통 밀도 하에서 서버고장을 고 려한 복수 서버 대기행렬 시스템의 체제시간에 관한 분 석을 수행하였다. 낮은 교통 밀도 하에서 고장 과정과 수 리과정이 포아송 과정일 때, 흡수 마코프 체인과 재생이 론을 이용하여 체제시간에 관한 정확한 해를 얻을 수 있 다. 위 방식은 고객의 집단 도착을 가정한 마코비안 복수 서버 시스템의 경우에도 적용될 수 있다. 이러한 방법론 은 비병목 공정과 같이 낮은 교통밀도 하에서 운영되고 있는 시스템의 체제시간에 관하여 유용한 정보를 제공하 고 있으며, 근사해법을 이론적으로 테스트 하는데 사용 될 수도 있다. 또한 본 연구에서는 평균 체제시간에 대한 식을 제시하고 그에 대한 직관적인 해석을 제공하는데, 이는 시스템의 특성을 논리적으로 이해하는데 큰 도움이 될 것으로 생각한다.