Journal Search Engine

ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)

Journal of Society of Korea Industrial and Systems Engineering Vol.42 No.4 pp.194-202
DOI : https://doi.org/10.11627/jkise.2019.42.4.194

An Application of Dirichlet Mixture Model for Failure Time Density Estimation to Components of Naval Combat System

Jinwhan Lee^*

, Jung Hun Kim^**

, BongJoo Jung^*

, Kyeongtaek Kim^*†

^*Department of Industrial Engineering, Hannam University
^**Joint Forces Military University

Corresponding Author : kkim@hnu.ac.kr

Received 10/12/2019 Finally Revised 25/12/2019 Accepted 27/12/2019

Abstract

Reliability analysis of the components frequently starts with the data that manufacturer provides. If enough failure data are collected from the field operations, the reliability should be recomputed and updated on the basis of the field failure data. However, when the failure time record for a component contains only a few observations, all statistical methodologies are limited. In this case, where the failure records for multiple number of identical components are available, a valid alternative is combining all the data from each component into one data set with enough sample size and utilizing the useful information in the censored data.

The ROK Navy has been operating multiple Patrol Killer Guided missiles (PKGs) for several years. The Korea Multi-Function Control Console (KMFCC) is one of key components in PKG combat system. The maintenance record for the KMFCC contains less than ten failure observations and a censored datum. This paper proposes a Bayesian approach with a Dirichlet mixture model to estimate failure time density for KMFCC. Trends test for each component record indicated that null hypothesis, that failure occurrence is renewal process, is not rejected. Since the KMFCCs have been functioning under different operating environment, the failure time distribution may be a composition of a number of unknown distributions, i.e. a mixture distribution, rather than a single distribution. The Dirichlet mixture model was coded as probabilistic programming in Python using PyMC3. Then Markov Chain Monte Carlo (MCMC) sampling technique employed in PyMC3 probabilistically estimated the parameters’ posterior distribution through the Dirichlet mixture model. The simulation results revealed that the mixture models provide superior fits to the combined data set over single models.

Key Words : Bayesian Inference , Dirichlet Mixture Model , Density Estimation

디리슈레 혼합모형을 이용한 함정 전투체계 부품의 고장시간 분포 추정

이 진환^*, 김 정훈^**, 정 봉주^*, 김 경택^*†

^*한남대학교 산업공학과
^**합동군사대학교 공군대학

초록

키워드 :

This article has been cited by 0 article in crossref

Cited-By

Funding:

Hannam University

1. 서 론

함정 전투체계와 같이 복잡한 부품으로 이루어진 시 스템의 운영자들은 임무수행의 목표를 달성하기 위하여 여러 가지 성능 척도들을 사용하고 있다. 이러한 성능 척 도들은 시스템의 각 부품에 대한 신뢰성을 바탕으로 계 산된다. 신뢰성을 계산하기 위하여 사용되는 고장 자료 는 통계를 위하여 사용하는 일반적인 자료와는 달리 다 음과 같은 특징을 갖는다. 첫째, 고장 자료는 통계분석을 할 정도의 충분한 크기에 미치지 못하는 경우가 많다[14, 18]. Bendell[2]은 자료의 크기가 작을 때, 자료에 포함된 정보의 양이 작기 때문에 모든 통계적 방법론이 제한된 다고 지적하였다. Percy et al.[20]은 일반적으로 고장 자 료는 그 크기가 10 이하라는 실증적인 증거가 있으므로, 크기가 작은 자료를 적절히 다룰 방법을 개발할 필요가 있다고 주장하였다. 둘째, 고장 자료는 중도절단 자료 (censored data)를 포함하는 경우가 많다[14, 18]. 중도절 단 자료는 생존기간의 양 끝점 중 한 쪽 이상이 알려져 있지 않은 경우를 의미한다. 중도절단 자료는 완전한 정 보를 담고 있지는 않지만, 정보를 전혀 담고 있지 않은 것은 아니다. 완전 자료(uncensored data)의 수가 아주 적 다면 중도절단 자료가 갖는 비중은 작지 않으며 이를 효 율적으로 활용할 필요가 있다.

국방 분야의 무기체계 획득과정에서 적용하고 있는 대부분의 MTBF(Mean Time Between Failure)는 단순히 지수분포만을 가정하여 추정함으로써 지수분포의 무기 억성으로 인한 정비주기, 수리부속 및 정비대체장비 산 정결과의 비현실성이 상존한다[9]. 항공전자장비의 경우, 개발할 때 예측한 MTBF가 운용할 때의 MTBF보다 크게 는 3배 이상까지 보수적으로 추정되어 있어, 과다한 재 고로 인한 낭비를 초래할 수 있다고 연구되었다[7]. 무 기획득 과정이나 장비의 운영 초기에는 생산자가 제시한 MTBF를 사용할 수밖에 없지만, 장비의 운영에 대한 자 료가 축적되면 야전 정비 자료를 바탕으로 신뢰도를 다 시 계산하여야 보다 효율적이고 경제적인 정비계획을 세 울 수 있다.

국내에서 개발한 해군 함정 전투체계의 시초인 유도 탄고속함의 전투체계는 센서체계, 지휘무장통제체계, 무 장체계로 구성되어 있다. 이 중에서 지휘무장통제 체계 는 핵심 구성품인 한국형 다기능 통제콘솔(Korea Multi- Function Control Console, KMFCC), 지휘무장통제 캐비 넷, 연동단 등으로 구성된다[9]. 유도탄고속함의 전투체 계의 다기능 통제콘솔은 고장이 나는 경우 전투체계 전 체를 마비시켜 전투임무 수행을 거의 불가능하게 만드는 매우 중요한 부품이다. 다기능 통제콘솔은 신뢰성이 비 교적 높은 부품이기 때문에 수 년 동안 운영을 해도 그 고장 자료가 통계분석을 할 만큼 충분하게 획득되지 않 는 경우가 대다수이다. 아울러, 다기능 통제콘솔은 여러 함정에 설치되어 있으며, 고장 자료에 중도절단 자료를 포함하고 있다.

본 연구에서는 다기능 통제콘솔과 같이, 동일한 여러 개의 부품이 존재하면서 각 개별 부품에 대해서는 통계 분석을 할 만큼 고장 자료가 빈번하지 않은 경우, 완전 자료 및 중도절단 자료 모두를 이용하여 부품의 신뢰성 을 계산하는 문제를 다룬다.

국방 분야에서 운용 장비의 신뢰도에 관한 선행연구들 은 다음과 같다. Lee와 Yum[12]은 수리가 가능한 시스템 의 신뢰성 분석 절차를 제시하고, 군에서 운용중인 장비 의 고장 자료를 수집하여, 완전 자료를 이용하여 신뢰성 분석을 하였다. Kim 등[9]은 함정 전투체계 시스템에 사 용된 부품들의 고장 자료를 이용하여 MTBF를 추정하고 운영대체장비의 소요분석을 최초로 제시하였다. 고장 자 료를 분석할 때 중도절단 자료를 제외하였으며, 고장 분 포를 단일 분포로 가정하여 자료에 가장 적합한 분포를 선택하였다. Na와 Chang[17]은 좌측 중도절단 자료가 있는 탱크 고장 자료를 결합한 후 EM(Expectation-Maximization) 알고리즘을 사용하여 고장률을 추정하는 방법을 제시하 였다. 이 연구에서는 결합된 고장 자료의 고장 패턴이 와 이블(Weibull) 분포를 따른다고 가정하여 파라미터를 추 정하였다. 좌측 중도절단 자료를 사용하였다는 점에서 자 료를 효율적으로 활용한 연구다. Kim과 Kim[8]은 중도절 단 자료를 포함하여 무기체계의 고장 자료를 수집 하였 다. 완전 자료에 대한 추세 검정을 수행하여 경향성이 없 음을 확인한 후 고장 자료를 통합하고, MINITAB을 사용 하여 자료에 가장 적합한 분포를 선택하였다. Seo 등[22] 은 함정용 유도탄에 대한 신뢰도 분석을 위하여 고장 자 료의 모집단이 단일 분포를 따른다는 가정 하에서 가장 적합한 분포를 선택한 후, 표본을 통해 파라미터를 추정 하였다.

지금까지 언급된 연구들은 다음 두 가지 면에서 개선 의 여지가 있다. 첫째, 중도절단 자료를 충분히 활용하지 않았다. 선행 연구에서 완전 자료를 사용한 연구들이 다 수이며[8, 9, 10, 22, 12], 자료 수집 단계에서 중도절단 자료를 수집한 경우에도 분석단계에서는 완전 자료만을 사용한 경우도 있다[8, 9]. 중도절단 자료를 명시적으로 사용한 연구로는 Na와 Chang[17]의 연구가 유일하다. 마 지막 사건 발생시점부터 중도절단까지의 시간을 무시하 는 것은 고장시간 분포에 상당한 편향을 야기할 수 있다 는 연구가 있으므로[11], 완전 자료와 함께 중도절단 자 료도 활용하는 분석의 필요성이 제기 된다. 둘째, 모든 선행 연구에서 결합된 자료에 대하여 단일분포 함수에 적합 하였다. 그러나, 동일한 부품도 설치 위치와 운용 환경 등에 따라 상이한 고장 패턴이 나타날 수 있다[5, 14]. 따라서 실제 운용되는 각 부품의 고장 자료를 결합 한 통합 자료는 서로 다른 분포들의 결합에 의해 더 유 연하게 표현될 수 있다.

Garmabaki et al.[5, 6]은 여러 시스템에 설치된 동일한 부품의 고장 자료를 결합하고자 할 때 사용할 수 있는 전체적인 프레임웍을 제시하였다. 이 프레임웍에서는 자 료들을 결합하기 전에 개별 부품에 대한 추세 검정을 바 탕으로 결합해서 사용할지 여부를 결정한다. 이는 앞에 서 언급한 대부분의 연구에서 수행된, 각 부품에 대한 추 세 검정 없이 자료들을 결합한 후에 추세 검정을 하는 방법과는 다르다.

본 연구에서는 개별 부품의 고장 패턴에 대한 추세 검 정을 할 때에 중도절단 자료를 포함하여 검정을 하며, 고 장시간 분포를 적합(fitting)할 때도 중도절단 자료를 포 함하여 사용한다. 또한 결합된 자료에 대해서 단일 분포 가 아니라 파라미터 값이 다른 함수들의 혼합된 분포 형 태로 가정하여 확률밀도함수를 구한다.

본 논문의 구성은 다음과 같다. 제 2장에서는 고장 자 료들의 결합 가능 여부를 판단하기 위하여 추세 검정을 할 때 사용하는 검정 통계량을 살펴본다. 제 3장에서는 결합된 자료들을 여러 분포가 혼합된 모형으로 표현하는 방법과 베이지안 추론을 이용하여 확률밀도함수를 구하 는 방법을 서술한다. 제 4장에서는 다기능 통제콘솔의 고장 자료를 이용하여 확률밀도함수를 구하는 사례를 제 시하고, 제 5장에서는 결론을 맺는다.

2. 추세 검정

어떠한 부품이 여러 대의 탱크나 여러 척의 함정 등과 같이 동일한 시스템에 사용 될 때 개별 부품에 관한 고 장 횟수가 충분하지 않다면, 먼저 각 부품들의 고장 자료 를 결합할 수 있는 조건을 갖추고 있는지를 추세 검정을 통하여 확인한다.

대부분의 추세 검정은 고장 패턴이 HPP(Homogeneous Poisson Process)이라는 귀무가설에 대한 검정을 한다. 그 러나 실제적으로 포아송 파라미터에 대하여 이론적인 분 산보다 관측치의 분산이 일반적으로 더 큰 과대산포 (overdispersion) 현상이 발생한다고 알려져 있다. 따라서 고장 패턴이 HPP라는 귀무가설보다 더 일반적인 귀무가 설이 필요하다. 더 일반적인 귀무가설에 대한 일치된 견 해는 없으나, RP(Renewal Process)가 분석적인 면에서 최 적의 대안이라는 주장이 있다[10, 13]. RP란 부품이 수리 되면 새로운 부품으로 교체한 것으로 본다. 이 경우, 부 품을 수리한 후 다음 고장까지의 시간 분포는 iid(independently and identically distributed)라 가정한다. 본 장에서 는 고장 패턴이 RP라는 귀무가설을 설정하고 이에 관한 검정 통계량을 살펴본다.

2.1 완전 자료에 대한 추세 검정

완전 자료만을 사용하는 검정 통계량들을 소개하기 위하여 다음 기호를 사용한다.

n : 고장 횟수
$T_{1}, T_{2}, \dots, T_{n}$ : 고장시간(T₀ = 0)
$X_{1}, X_{2}, \dots, X_{n}$ : 수리 후 다음 고장까지 시간 여기에서 $X_{i} = T_{i} - T_{i - 1}$
I ( X_i < X_j ) : X_i < X_j이면 1, 그렇지 않으면 0

다음은 완전 자료의 고장패턴이 RP라는 귀무가설에 대한 기각여부를 결정하는 검정 통계량이다.

1) Mann 검정

M = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} I (X_{i} < X_{j})

(1)

Mann 검정 통계량은 다음과 같다.

M_{m a n n} = \frac{M - n (n - 1) / 4}{\sqrt{2 n^{3} + 3 n^{2} - 5 n / 72}}

(2)

M_mann은 근사적으로 표준정규분포를 따른다. 만일 ∣M_mann∣
> Z_α_/2이면 유의수준 α로 귀무가설을 기각한다.

2) Lewis-Robinson 검정

L = \sqrt{12 (n - 1)} [\frac{\sum_{i = 1}^{n - 1} T_{i}}{(n - 1) \cdot T_{n}} - 0.5]

(3)

Lewis-Robinson 검정 통계량은 다음과 같다.

L R = \frac{\bar{X} L}{σ (X)}

(4)

LR은 근사적으로 표준정규분포를 따른다. 만일 ∣LR∣
> Z_α_/2이면 유의수준 α로 귀무가설을 기각한다.

2.2 중도절단 자료가 포함된 경우의 추세 검정

중도절단 자료가 포함된 고장 자료를 사용하는 검정 통계량들을 소개하기 위하여 다음 기호를 사용한다.

τ : 중도절단 시간(단, τ > 0)
N (τ) : t = 0부터 t = τ까지 고장발생횟수
$T_{1}, T_{2}, \dots, T_{N (τ)}$ : 고장시간(T₀ = 0)
$X_{1}, X_{2}, \dots, X_{N (τ)}$ : 수리 후 다음 고장까지 시간 여기에서 $X_{i} = T_{i} - T_{i - 1}$

$\begin{array}{l} \hat{μ} = E (X_{i}) \\ \hat{σ} = \sqrt{V a r (X_{i})} \\ \hat{γ} = \frac{\hat{σ}}{\hat{μ}} \end{array}$

고장 자료가 완전 자료와 우측 중도절단자료로 이루 어져 있는 경우, 최근에 Kvaløy와 Lindqvist[10]는 고장 패턴이 RP를 이룬다는 귀무가설에 대하여 다음과 같은 검정 통계량을 제시하였다.

1) Anderson-Darling(AD) 유형 검정

\begin{matrix} A D T = \frac{1}{{\hat{γ}}^{2}} \cdot \frac{1}{N (τ)} {\sum_{i = 1}^{N (τ) - 1} [{(N (τ) - i)}^{2} ln (\frac{τ - T_{i}}{τ - T_{i + 1}}) \\ + i^{2} ln (\frac{T_{i + 1}}{T_{i}})] + N {(τ)}^{2} [ln (\frac{τ}{τ - T_{1}}) + ln (\frac{τ}{T_{N (τ)}}) - 1] \end{matrix}

(5)

ADT는 근사적으로 Anderson-Darling 통계량 분포를 따른다. 이 ADT는 단조 증가, 단조감소 추세 및 비 단조 추세 모두에 대하여 민감하기 때문에 ADT가 큰 값을 가지면 귀무가설을 기각한다.

2) Lewis-Robinson(LR) 유형 검정

L R T = \frac{1}{\hat{γ}} \cdot \frac{\sqrt{12}}{τ \sqrt{N (τ)}} [\sum_{i = 1}^{N (τ)} T_{i} - \frac{N (τ)}{2} τ]

(6)

LRT는 근사적으로 표준 정규분포를 따른다. 이 검정 통계량은 단조 증가 또는 단조 감소 추세에 의해 RP 로부터 얼마나 벗어나 있는지를 알려준다. LRT가 양 수이면 단조 증가하는 추세이고 음수이면 단조 감소 하는 추세이다.

2.3 자료 수가 적은 경우의 추세 검정

앞장에서 제시한 검정 통계량은 귀무가설의 기각여부 를 판별할 때 근사적인 분포나 근사적인 표준 정규분포 를 사용하므로, 자료의 수가 30 미만이면 검정의 정확도 가 떨어진다고 볼 수 있다. 고장 자료의 특성상 10개 내 외인 경우가 적지 않으므로[20], 이러한 샘플 크기를 갖 는 자료에 대한 앞선 방법과 같은 테스트의 적용은 오류 발생을 증가시킨다. Lawless 등[11]은 자료의 수가 적고, 정규분포 근사화가 부적합할 때, 완전 자료들을 순열검 정법(permutation test)을 통하여 시뮬레이션 하는 방법이 유효하다고 주장 하였으며, Kvaløy와 Lindqvist[10]는 시 뮬레이션을 통하여 이를 확인하였다.

3. 디리슈레 모형

3.1 혼합모형

동일한 부품도 설치 위치와 운용 환경, 그리고 유지보 수 정책 등에 따라 상이한 고장 패턴이 나타날 수 있다. 이러한 고장 패턴의 변화는 고장시간 분포의 변화로 이 어질 수 있다[5, 14]. 따라서 여러 시스템에 설치된 동일 한 부품의 자료들을 결합한 통합 자료의 고장시간 분포 는 서로 다른 분포들의 결합에 의해 더 잘 표현될 수 있 다. 이러한 이질적인 자료를 다룰 수 있는 유연한 틀을 제공하는 모형이 혼합모형이다. 혼합모형은 모집단을 여 러 부(副)모집단(sub-population)의 확률적 결합으로 표현 한다. 그러나 각 관측치가 어느 부모집단에 속한 표본인 지는 나타내지 않는다. x₁, x₂, ⋯, x_n이 알려져 있지 않은 확률밀도함수 f(x)를 갖는 모집단으로부터 얻어진 표본 이라 하자. 그러면, 혼합모형은 다음과 같이 표현된다.

f (x | π_{1}, \dots, π_{M}, θ_{1}, \dots, θ_{M}) \sim \sum_{j = 1}^{M} π_{j} k_{j} (x | θ_{j})

(7)

또는 간단하게 다음과 같이 표현할 수 있다.

f (x) \sim \sum_{j = 1}^{M} π_{j} k_{j} (x | θ_{j})

(8)

이 모형에서, 각 관측치는 M개의 부모집단중 하나로 부터 샘플링 된다고 가정하며, j번째 부모집단으로부터 샘플링될 확률은 π_j다. 혼합계수 π_j는 양수(π_j > 0)로, j번 째 모집단의 혼합 가중치를 나타내며, $\sum_{j = 1}^{M} π_{j} = 1$ 이다. f(t)는 M개의 부모집단 분포 $k_{j} (t | θ_{j})$ 들의 결합으로 구성 되며, j번째 부모집단의 분포 $k_{j} (t | θ_{j})$ 는 파라미터 벡터 θ_j 를 갖는다. 예를 들면 Gaussian 분포에서 $θ_{j} = (μ_{j}, σ_{j})$ 다. 만일 모집단들이 서로 다른 파라미터 값을 갖는 동일 분 포(즉, k₁ = k₂ = ⋯ = k_M)이나, θ_j는 서로 다름)라면,

f (x) \sim \sum_{j = 1}^{M} π_{j} k (x | θ_{j})

(9)

이 되며, 이때 k(t∣θ )를 커널(kernel)이라 부른다.

혼합모형의 파라미터를 추정하는 방법으로, EM 알고리 즘, 베이지안 추론 등이 있으며, 본 논문에서는 베이지안 추론을 사용한다. 베이지안 추론의 MCMC(Markov Chain Monte Carlo)를 이용하여 위 혼합모형에 대한 시뮬레이션 을 하면, 수집된 관측 데이터에 적합된 π_j와 θ_j의 사후확률 (posterior) 분포를 추정할 수 있다. 혼합모형을 사용하여 시뮬레이션을 하는 경우, 다음을 결정해야 한다.

1) 커널 함수 결정(예 : 정규분포, Weibull 분포 등)
2) M값의 최대치 결정
3) π_j의 사전확률(prior) 결정
4) θ_j의 사전확률 결정
5) 관측치를 π_j의 확률로 j번째 혼합 부모집단의 샘플 로 결정

커널 함수는 주어진 문제에 대한 사전 지식에 따라 여 러 함수들을 차례로 지정한다

최근까지 부모집단의 수 M의 최대값을 추정하기 위하여 베이지안 비모수(Bayesian NonParametric) 모형을 사용해 왔다. 그러나 이 방법은 최근에 정확하지 않은(inconsistent) 방법임이 증명되었다[15, 16]. 본 논문에서는 M값의 최대 치를 추정하기 위하여 함수에 적합하기 위한 최소 표본의 크기는 5~10개라는 연구결과[1, 3, 19]를 이용한다. 예를 들어, 자료의 수가 30이라면, M값의 최대치는 3~6이 된다.

3.2 디리슈레 혼합모형

혼합모형에 대한 시뮬레이션을 수행하기 위하여 주어 진 숫자만큼의 π_j를 무작위로 만들어 공급할 수 있는 함 수, 즉 π_j의 사전확률 분포가 필요하다. 디리슈레 분포 (Dirichlet Distribution) Dir(α)는 다변량 연속 함수로, π_j > 0과 Σπ_j = 1을 만족시키는 $π = (π_{1}, \dots, π_{M})$ 를 랜덤 하게 공급할 수 있으므로, 다항분포의 사전 확률분포로 사 용된다. 디리슈레 분포는 양수 벡터 α를 파라미터로 갖는 다. <Figure 1>은 양수 벡터 α에 따라 디리슈레 분포로부 터 π = (π₁, π₂, π₃)를 무작위로 생성하는 예를 색깔이 있는 막대로 보여준다. 색깔 막대의 크기는 π₁, π₂, π₃의 값을 나 타내며, 3개의 색깔 막대들로 이루어진 각 막대의 길이는 1이다. <Figure 1>은 벡터 α별로 각 10개의 표본을 보여주 고 있다. 동일한 스칼라 값들로 구성된 벡터 α의 경우, 스 칼라 값이 커질수록 분산이 작아지는 것을 알 수 있다.

θ_j의 사전 확률은 주어진 문제와 결정된 커널 함수에 따라 사용자가 결정한다. 사전 확률을 결정하는 분포를 G₀ (θ)라 하면, 모든 θ_j는 G₀ (θ )분포로부터 샘플링 된다.

잠재 변수(latent variable) c_i는 관측치 x_i가 몇 번째 부모 집단의 샘플인지를 나타낸다. 만일 c_i = 3이라 하면 x_i는 $k (t | θ_{3})$ 로부터 추출된 샘플을 의미한다. 관측치를 π_j의 확률로 j번째 혼합 부모집단으로부터 취한 샘플로 결정 하는 방법은 π값을 갖는 다항분포로부터 샘플을 취하여 c_i 값에 배정하는 과정으로 표현될 수 있다.

이상의 논의에서 베이지안 추론을 수행할 수 있도록 혼합모형을 다음과 같이 쓸 수 있다.

\begin{matrix} x_{i} | c_{i} \sim f (x | θ_{c_{i}}), & i = 1, \dots, n \end{matrix}

(10)

\begin{matrix} c_{i} \sim m u l t i n o m i a l (π), & i = 1, \dots, n \end{matrix}

(11)

\begin{array}{l} \begin{matrix} θ_{j} \sim G_{0} (θ), & j = 1, \dots, M \end{matrix} \\ π | α \sim D i r (α) \end{array}

(12)

우측 중도절단 자료를 포함하는 경우, 가능도(likelihood) 를 계산하기 위하여 다음과 같은 기호를 사용한다.

$T_{1}, T_{2}, \dots, T_{n}$ : 실제 고장시간
$C_{1}, C_{2}, \dots, C_{n}$ : 중도절단 시간
$x_{i} = min (T_{i}, C_{i})$
$\begin{array}{l} δ_{i} = I (T_{i} \leq C_{i}) = 1 if T_{i} \leq C_{i} (고장 관측) \\ 0 if T_{i} > C_{i} (중도절단 관측) \end{array}$
$(x_{1}, δ_{1}), (x_{2}, δ_{2}), \dots, (x_{n}, δ_{n})$ : 관측자료
f(x_i∣θ ) : 고장시간이 x_i일 확률
F (x_i∣θ ) : 고장시간이 x_i보다 작을 확률
S (x_i∣θ ) : 고장시간이 x_i보다 클 확률

우측 중도절단 자료를 포함하는 경우, 가능도는 다음 과 같이 표현된다.

\begin{matrix} L (θ | x, δ) = \prod_{i = 1}^{n} [f {(x_{i} | θ)}^{δ_{i}} \cdot S {(x_{i} | θ)}^{(1 - δ_{i})}] \\ \prod_{i = 1}^{n} {f {(x_{i} | θ)}^{δ_{i}} \cdot [1 - F {(x_{i} | θ)}^{(1 - δ_{i})}]} \end{matrix}

(13)

시뮬레이션을 이용하여 사후 확률을 계산할 때, 버림 오차(round-off)로 인하여 결과가 왜곡되는 현상이 발생 하므로, 식 (13)에 로그를 취하여 계산한 후, 다시 지수함 수를 이용하여 원래 결과를 얻는다. 로그를 취한 가능도 는 다음과 같다.

\sum_{i} δ_{i} log f (x_{i} | θ) + \sum_{i} (1 - δ_{i}) log (1 - F (x_{i} | θ))

(14)

3.3 최적 모형 선택

디리슈레 혼합모형의 시뮬레이션을 통하여, 각 커널 함 수에 대한 파라미터들을 추정한 다음, 어떤 모형이 데이 터에 가장 잘 적합하는 지를 테스트하여, 최적 모형을 선 택한다. 중도절단 자료가 존재하므로, 완전 자료에 잘 적 합하는 모형이 최적 모형이라고 할 수 없다. 중도절단을 포함하는 자료를 갖는 부품의 생존 확률을 계산하는 방법 중에서 가정 널리 알려진 방법은 카플란-마이어(Kaplan- Meier) 방법이다. 카플란-마이어 방법은 비모수 통계를 이용하여 생존 함수를 추정한다.

본 논문에서는 카플란-마이어 방법으로 구한 생존 함 수에 가장 근접한 모형을 최적모형으로 선택한다. 카플란 -마이어 방법으로 구한 생존 함수와 혼합모형으로부터 구 한 생존함수와의 차이를 테스트하기 위하여 Two-Sample Kolmogorov-Smirnov(KS) 테스트를 이용한다. KS 테스트 는 두 개의 데이터 집합이 같은 분포로부터 왔는지를 점 검하는 테스트이다.

4. 사례연구

본 장에서는 디리슈레 혼합모형을 이용하여, 유도탄고 속함에 설치된 다기능 통제콘솔의 고장시간에 대한 확률 밀도함수를 도출하는 예를 서술한다. 다기능 통제콘솔의 고장 자료를 모아, 수리 후부터 고장까지의 시간을 누적 하여 기록한 다음, 각 함정에서 온 고장 자료가 균일하게 영향을 갖게 하기 위하여 총 누적 시간이 동일하도록 자 료를 정리하였다. 정리된 고장 기록 내용을 <Figure 2>에 나타내었다.

4.1 추세 검정

수집된 다기능 통제콘솔의 고장 자료는 중도절단 자 료를 포함하고 있다. 각 함정에서 온 부품의 고장 패턴이 RP인지를 검정하기 위하여 중도절단 자료가 포함된 고 장 자료에 대한 AD 유형 검정과 LR 유형 검정을 실행하 였다. <Table 1>은 검정 결과를 보여준다.

<Table 1>은 모든 부품(Unit)에 대한 AD 유형 검정 및 LR 유형 검정의 유의확률이 모두 0.05 이상으로 귀무가 설(고장 패턴이 RP를 이룬다)을 기각할 수 없음을 보여 준다. 그러나 각 부품의 고장 자료 중 완전 자료의 수가 5 ~ 9로 매우 적으므로, 근사적인 분포나 근사적인 표준 정규분포를 사용하여 유의확률을 계산하면 그 결과를 신 뢰하기 어렵다. 따라서 순열검정법을 통하여 검정 통계 량을 다시 계산하여, 각 부품의 고장 패턴이 RP를 이루 는지 여부를 재확인할 필요가 있다. 순열검정법을 이용 한 검정 결과는 <Table 2>에 나타나있다. <Table 2>에 따르면, 각 부품의 고장 패턴은 RP라는 귀무가설을 기각 할 수 없다.

<Figure 1>에서 Unit 6, 7, 8은 해당 기간 동안 전혀 고 장이 나지 않았다. 본 논문에서는 고장 패턴이 RP인 부 품 1, 2, 3, 4, 5와 고장이 나지 않은 부품 6, 7, 8의 기록 을 하나의 데이터 셋으로 결합하여 확률밀도함수 도출의 자료로 사용하였다.

4.2 확률밀도함수 도출

본 사례연구에서는 각 부품의 고장 패턴은 동일한 확 률밀도함수를 가지되, 사용조건에 따라 파라미터 값만 달 라진다고 가정한다. 또한, 한 부품의 고장 패턴은 사용 조 건의 변경에 따라, 확률밀도함수의 파라미터 값이 여러 번 변할 수 있다고 가정한다. 사용된 데이터 45개중에서 완전 데이터는 37개 이다. 분포에 적합하기 위한 최소 샘 플사이즈는 5~10개로 보는 것이 일반적이므로, 부모집단 의 수의 최대치는 3~7이라 볼 수 있으며, 보수적인 관점 으로 보아 7로 고정하였다

혼합모형에 사용할 커널 분포로, 신뢰성 분포 추정에 널리 사용되는 Weibull 분포, Lognormal 분포, Loglogistic 분포를 사용하였다. 커널 분포에 사용되는 파라미터의 사 전 분포로 HalfNormal 분포를 사용하였으며, 각 커널에 맞도록 범위를 부여하였다.

베이지안 추론을 이용한 시뮬레이션은 파이썬 프로그 램과 PyMC3[21]를 사용하여 수행하였다. PyMC3는 사용 자가 프로그래밍 코드로 나타낸 확률적 모형에 대하여 자 동적으로 베이지안 추론을 행하는 확률적 프로그래밍 (Probabilistic Programming) 언어다. <Figure 3>는 완전 자 료만을 사용하였을 때에 2개의 부모집단을 갖는 Weibull 혼합모형에 대한 파라미터 값의 사후 분포의 샘플링 패턴 을 보여준다.

시뮬레이션을 수행하여 커널 함수 별로 혼합모형의 파라미터들의 사후 확률을 구한 후, 이를 이용하여 생존 함수를 구하였다. 도출된 생존 함수는 KS 테스트를 실행 하여 카플란-마이어 생존 함수와 비교 하였다. <Table 3> 는 각 커널 함수에 대하여, 부모분포함수의 수에 따른 KS 테스트를 실행하여 얻어진 유의확률을 나타내었다. 표에서 *는 혼합 가중치 π_j 중에서 0.135 미만이 하나라 도 나타나는 혼합모형을 나타낸다. 이는 표본이 평균적 으로 5개 미만인 부모집단이 포함된 혼합모형임을 의미 한다. 이 경우 혼합모형을 구성할 때, 5개 이상의 데이터 가 하나의 부모집단으로 온다는 원래의 가정을 위반했으 므로, 최적 모형의 대상에서 제외한다. <Table 3>는 3개 의 커널 분포 모두, 단일 분포보다 혼합 분포가 더 적합 함을 보여주고 있으며, 각 커널 분포 내에서 부모집단의 수에 따른 유의확률의 차이가 크지 않다고 판단된다. 이 런 경우 가장 간단한 모형이 최적 모형이 되므로, 각 커 널함수에서, 부모집단의 수가 2인 모형이 최적 모형이라 할 수 있다. <Table 4>는 최적 모형의 파라미터 추정치 를 보여준다.

5. 결 론

본 연구에서는 동일한 여러 개의 부품이 존재하면서 각 개별 부품에 대하여는 통계분석을 할 만큼 고장 데이 터가 빈번하지 않은 경우, 디리슈레 혼합모형을 이용하 여 고장시간 분포를 계산하는 방법을 제시 하였다. 이 방 법은 고장시간 분포를 단일모형이 아닌 다수의 모집단분 포를 결합한 혼합모형으로 표현한다는 특징을 가진다. 혼합 모형을 사용함으로써 사용환경에 따른 고장시간 패 턴의 변화 가능성까지 유연하게 표현할 수 있는 장점이 있다. 아울러, 개별 부품의 고장 패턴에 대한 추세 검정 을 할 때에 중도절단 자료를 포함하여 검정을 하며, 고장 시간 분포를 적합할 때도 중도절단 자료를 포함하여 사 용함으로서, 고장 자료를 효율적으로 활용한다. 본 연구 에서 제시한 방법을 적용하여 해군함정에 사용되는 다기 능 통제콘솔의 고장시간 밀도 함수를 구한 결과, 사용된 모든 커널함수에서 단일모형보다 혼합모형을 적용했을 때, 카플란-마이어 생존 곡선에 보다 근접한 분포를 생성 하였다.

그러나 본 모형은 시간 변수만을 표현함으로써 소프 트웨어나 하드웨어 또는 정책 등의 변화에 따른 고장률 의 변화를 반영하지 못하는 한계를 가지고 있다.

향후에는 본 연구에서 사용된 Weibull 분포, Lognormal 분포, Loglogistic 분포 이외의 다른 분포에도 적용하여 보 다 더 적합성을 가지는 분포가 있는지 살펴볼 필요가 있 다. 또한, 혼합된 분포에 영향을 미칠 수 있는 여러 요인 들을 모형에 추가하여 시뮬레이션을 수행함으로써, 이러 한 요인들이 분포에 미치는 영향을 확인하는 연구로 확장 할 수 있을 것으로 기대한다.

Acknowledgement

We thank Dr. Jan Terje Kvaløy (University of Stavanger, Norway) for providing R-code for trend tests. This work was supported by 2018 Hannam University Research Fund.

Figure

<Figure 1>.

Samples from Dirichlet Distribution[4]

<Figure 2>.

Failure Event Plot

<Figure 3>.

Density Estimate and Simulated Trace for a Parameter

Table

<Table 1>.

p-value by Asymptotic Approach

<Table 2>.

p-value by Permutation Approach

<Table 3>.

KS Statistics

<Table 4>.

Parameter Values of the Best Models

Reference

Austin, P.C. and Steyerberg, E.W., The Number of Subjects per Variable Required in Linear Regression Analyses, Journal of Clinical Epidemiology, 2015, Vol. 68, pp. 627-636.
Bendell, T., An Overview of Collection, Analysis, and Reliability Data in the Process Industries, IEEE Transactions on Reliability, 1998, Vol. 37, pp. 132-137.
Cho, H.J., Lim, J.H., and Kim, Y.S., A Comparison of the Reliability Estimation Accuracy between Bayesian Methods and Classical Methods Based on Weibull Distribution, Journal of the Korean Institute of Industrial Engineers, 2016, Vol. 42, No.4, pp. 256-262.
Frigyik, B.A., Kapila, A., and Gupta M.R., Introduction to the Dirichlet Distribution and Related Process, [TechnicalReport], UWEETR-2010-0006, [Seattle, USA] : University of Washington, 2010.
Garmabaki, A.H.S., Ahmadi, A., Block, J., Pham, H., and Kumar, U., A Reliability Decision Framework for Multiple Repairable Units, Reliability Engineering and System Safety, 2016, Vol. 150, pp. 78-88.
Garmabaki, A.H.S., Ahmadi, A., Mahmood, Y.A., and Barabadi, A., Reliability Modelling of Multiple Repairable Units, Quality and Reliability Engineering International, 2016, Vol. 32, pp. 2329-2343.
Jo, I.T., Lee, S.C., and Park, J.H., A Study on Reliability Growth through Failure Analysis by Operational Data of Avionic Equipments, Journal of Society of Korea Industrial and Systems Engineering, 2013, Vol. 36, No. 4, pp. 100-108.
Kim, M-S. and Kim, J.-J., Field Data Analysis for a Repairable System, Journal of the Korean Institute of Plant Engineering, 2017, Vol. 22, No. 3, pp. 3-10.
Kim, Y.-J., Oh, H.-S., and Choi, B.-W., A Study of Reliability analysis and Application on Naval Combat System Using Field Critical Failure Data, Journal of Society of Korea Industrial Systems Engineering, 2016, Vol. 39, No. 4, pp. 49-59.
Kvaloy, J.T. and Lindqvist, B.H., A Class of Tests for Trend in Time Censored Recurrent Event Data, Technometrics, 2019,
Lawless, J., Cigsar, C., and Cook, R., Testing for Monotone Trend in Recurrent Event Processes, Journal of Technometrics, 2012, Vol. 54, pp. 147-158.
Lee, S.H. and Yum, B.J., Reliability Analysis Procedures for Repairable Systems and Related Case Studies, Journal of the KIMST, 2006, Vol. 9, No. 2, pp. 51-59.
Lewis, P.A.W. and Robinson, D.W., Testing for a Monotone Trend in a Modulated Renewal Process, Reliability and Biometry, SIAM, 1974, pp. 163-182.
Louit, D.M., Pascual, R., and Jardine, A.K.S., A Practical Procedure for the Selection of Time-to-Failure Models based on the Assessment of Trends in Maintenance Data, Reliability Engineering and System Safety, 2009, Vol. 94, pp. 1618-1628.
Miller, J.W. and Harrison, M.T., A Simple Example of Dirichlet Process Mixture Inconsistency for the Number of Components, Advances in Neural Information Processing Systems, 2013, pp. 199-206.
Miller, J.W. and Harrison, M.T., Inconsistency of Pitman- Yor Process Mixtures for the Number of Components, Journal of Machine Learning Research, 2014, Vol. 15, No. 1, pp. 3333-3370.
Na, I.Y. and Chang, W., Multi-System Reliability Trend Analysis Model using Incomplete Data with Application to Tank Maintenance, Quality and Reliability Engineering International, 2017, Vol. 33, pp. 2385-2395.
NIST/SEMATECH, e-Handbook of Statistical Methods, http://www.itl.nist.gov/div898/handbook/, 2012.
Peduzzi, P., Concato, J., Kemper, E., and Feinstein, A.R., A Simulation Study of the Number of Events per Variable in Logistic Regression Analysis, Journal of Clinical Epidemiology, 1996, Vol. 49, pp. 1373-1379.
Percy, D.F., Kobbacy, K.A.H., and Fawzi, B.B., Setting Preventive Maintenance Schedules When Data are Sparse, International Journal of Production Economics, 1997, Vol. 51, pp. 223-34.
Salvatier, J., Wiecki, T.V., and Fonnesbeck, C., Probabilistic Programming in Python using PyMC3, PeerJ Computer Science, 2016, Vol. 2, article e55.
Seo, Y., Lee, K., Lee, Y., and Kim, J., Reliability Prediction Based on Field Failure Data of Guided Missile, Journal of Applied Reliability, 2018, Vol. 18, No. 3, pp. 250-259.