1. 서 론
이상 탐지는 제조, 보안, 의료 등 다양한 산업 분야에서 시스템의 안정성과 신뢰성을 확보하기 위한 핵심 기술로 자리 잡고 있다. 특히 제조 현장의 센서 기반 데이터에서 는 정상 상태와 이상 상태의 패턴을 명확히 구분하는 것이 중요하다. 오토인코더(Autoencoder)는 <Figure 1>과 같이 입력 데이터를 압축․복원하는 방식으로 정상 패턴을 학 습하고, 복원오차(Reconstruction Error)를 통해 이상치를 탐지하는 기법으로 널리 활용되고 있다[3].
그러나 기존 오토인코더 기반 방법들은 주로 평균제곱 오차(Mean Squared Error, MSE)나 평균절대오차(Mean Absolute Error, MAE)와 같은 단일 기준 손실 함수를 사용 하기 때문에, 다양한 형태의 이상치나 비정규 분포 환경에 서는 성능이 제한적일 수 있다[10]. 실제 산업 현장에서 발생하는 이상치는 정규분포의 중심에서 벗어난 두꺼운 꼬리 분포 (Heavy-tail distribution)의 특성을 보이는 경우 가 많으며, 단일 분포 기반 손실 함수는 이러한 이상치를 효과적으로 탐지하지 못하는 한계를 가진다[6].
본 연구에서는 이러한 한계를 극복하기 위해 가우시안 분포(Gaussian), 라플라스 분포(Laplace), 스튜던트-t 분포 (Student-t)를 조합한 혼합 음의 로그 우도 손실 함수 (Mixture Negative Log-Likelihood Loss, Mixture NLL)를 제안한다. 제안된 손실 함수는 각 분포의 확률 밀도함수에 기반한 음의 로그 가능도를 혼합하여, 다양한 유형의 이상 치를 보다 유연하게 포착할 수 있도록 설계되었다. 또한 각 구성 분포에 대해 분산 또는 스케일, 자유도 등의 파라 미터를 학습 가능한 형태로 도입하여, 데이터의 통계적 특 성에 최적화된 확률 모델링이 가능하도록 하였다.
제안한 방법의 주요 기여는 다음과 같다.
-
1) 오토인코더 모델에 대하여 가우시안, 라플라스, 스튜 던트-t 분포의 혼합 구조를 적용한 혼합 손실 함수 제안
-
2) 각 구성 분포의 파라미터(표준편차, 스케일, 자유도) 를 학습 가능하도록 설계하여 데이터에 대한 적응적 표현력 확보
-
3) 다양한 이상 탐지 벤치마크 데이터셋을 활용한 실험 을 통해 제안 기법의 성능 검증 및 기존 손실 함수와 의 비교평가
이러한 내용을 바탕으로, 본 논문에서는 제안한 혼합 손 실 함수를 오토인코더에 통합하고, 이를 다양한 이상 탐지 벤치마크 데이터셋에 적용하여 기존 손실 함수들과의 성 능을 비교 평가한다.
논문의 구성은 다음과 같다. 2장에서는 관련 연구를 검 토하고, 3장에서는 제안한 손실 함수의 수식적 정의와 학 습 구조를 설명한다. 4장에서는 다양한 도메인에 대한 실 험 결과를 제시하고, 5장에서는 연구의 한계와 향후 연구 방향에 대해 논의한다.
2. Related Work
이상 탐지는 통계 기반 또는 비지도 학습 기반 알고리 즘을 중심으로 연구되어 왔다. 대표적인 기법으로는 PCA 기반 이상 탐지(PCA-Based Anomaly Detection) [8], k-최근접 이웃(k-Nearest Neighbors, k-NN) [5], One-Class SVM[7] 등이 있으며, 이들은 구조가 단순하 고 계산이 효율적이며 해석이 용이하다는 장점을 가진다. 그러나 이러한 전통적 방법들은 고차원 데이터나 비선형적 인 이상 패턴이 포함된 경우, 탐지 성능에 한계가 있다[2].
이와 같은 한계를 보완하기 위해 최근에는 오토인코더 기반의 딥러닝 접근 방식이 널리 활용되고 있다. 오토인코 더는 정상 데이터를 입력받아 이를 압축․복원하는 과정 을 학습하며, 입력과 복원값 간의 차이를 통해 이상 여부 를 판단하는 비지도 학습 구조이다. 일반적으로 평균제곱 오차 또는 평균절대오차를 손실 함수로 사용하여 복원 정 확도를 최적화한다[3][10]. 그러나 기존 손실 함수들은 복 원 오차가 정규분포를 따른다는 가정에 기반하고 있어, 실 제 산업 현장에서 자주 발생하는 비정규적이거나 두꺼운 꼬리 분포를 따르는 이상치에 대해서는 탐지 민감도가 낮 다는 문제가 제기되어 왔다[9].
이를 보완하기 위해, 확률 기반 손실 함수에 대한 연구 가 활발히 진행되어 왔다. 가우시안 음의 로그 우도 (Gaussian Negative Log-Likelihood)는 정규분포를 가정하 여 복원 오차의 분산(또는 표준편차)을 학습 가능한 파라 미터로 도입함으로써, 예측 불확실성을 정량화하는 데 활 용된다[4]. 그러나 이는 여전히 정규성 가정을 내포하고 있어, 비정규 분포나 두꺼운 꼬리 분포에 대한 적응력에는 한계가 존재한다. 라플라스 분포 기반 손실 함수는 절대 오차에 대한 확률 해석을 부여하며, 스케일 파라미터를 통 해 데이터 분포의 척도를 조절할 수 있다. 평균절대오차는 라플라스 분포의 최대우도추정(MLE) 해로 해석될 수 있 으며, 따라서 라플라스 음의 로그 우도 (Laplace Negative Log-Likelihood)는 평균절대오차의 확률적 일반화로 간주 된다. 이와 같은 방식은 최근 적응형 손실 함수의 구성 요 소로도 활용되고 있다[1]. 스튜던트-t 음의 로그 우도 (Student-t Negative Log-Likelihood)는 자유도(degree of freedom)를 통해, 두꺼운 꼬리 분포를 효과적으로 표현할 수 있으며, 기존에는 변분오토인코더(Variational Autoencoder) 의 잠재 공간(latent space) 밀도 추정에 활용된 바 있다[9]. 그러나 이들 손실 함수는 공통적으로 단일 분포에 기반하 고 있기 때문에, 다양한 이상치 유형을 동시에 포착하기에 는 표현력에 한계가 존재한다. 또한 대부분 입력 자체나 잠재 공간의 분포에 적용되어 왔으며, 복원 오차의 분포를 명시적으로 혼합 확률 모델로 구성한 연구는 거의 보고되 지 않았다.
이와 같은 연구 공백을 보완하고자, 가우시안, 라플라스, 스튜던트-t 분포를 통합한 혼합 손실 함수를 제안한다. 제안 된 손실 함수는 각 분포의 기여도를 소프트맥스(softmax) 기반으로 자동 조정하며, 분포별 파라미터(표준편차, 스케 일, 자유도)를 학습 가능한 구조로 설계함으로써 이상 탐지 의 민감도와 유연한 표현력을 동시에 확보하고자 한다.
3. Proposed Method
복원 기반 오토인코더 구조에 대하여, 가우시안, 라플라 스, 스튜던트-t 분포를 결합한 혼합 손실 함수를 제안한다. 각 분포는 이상치의 특성에 따라 상이한 반응을 보이므로, 이들을 혼합함으로써 단일 분포 기반 손실 함수의 한계를 극복하고 이상 탐지 성능을 향상시킬 수 있다. 전체 학습 구조는 <Figure 2>에 제시되어 있다.
3.1 Mixture NLL Loss Function
입력xi에 대해 오토인코더는 복원값 를 생성하고, 복 원 오차는 식 (1)과 같이 정의된다.
오차 ei에 대하여 가우시안, 라플라스, 스튜던트-t분포 에 기반한 개별 확률 밀도함수는 식 (2), (3), (4)와 같다.
이들을 혼합한 전체 확률 밀도 함수는 식 (5)와 같이 정 의된다.
여기서 혼합 가중치 πk는 소프트맥스를 통해 정규화되 며, 학습 가능한 파라미터(logitsk)는 식 (6)에 기반한다.
최종 손실은 전체 샘플에 대한 음의 로그 가능도 평균 으로 정의되며, 식 (7)과 같다.
3.2 Trainable Parameters and Learning Mechanism
제안된 손실 함수는 다음의 분포 파라미터 및 혼합 가 중치를 포함하며, 모두 end-to-end 방식으로 학습된다.
-
가우시안의 표준편차: σG = exp(logσG)
-
라플라스의 스케일 파라미터: b = exp(logb)
-
스튜던트-t의 표준편차 σT 및 자유도 υ: σT = exp(logσT), υ
-
각 분포의 혼합 가중치 πk = softmax (logitsk)
모든 파라미터는 loss gradient에 따라 업데이트되며, 각 각에 대한 미분은 식 (8)과 같다.
오토인코더 파라미터 θ에 대한 역전파는 식 (9)와 같이 이루어진다.
3.3 Anomaly Scoring
학습이 완료된 후, 이상 점수는 식 (10)과 같이 정의된다.
이 점수는 임계값(threshold) 또는 정밀도-재현율(precision- recall) 기준에 따라 이상 여부를 판별하는 데 사용된다.
3.4 Visualization of Mixture Behavior
혼합 손실 함수는 복원 오차의 크기에 따라 각 분포의 기여도가 달라지는 특징을 가진다.
<Figure 3>는 로 고정된 설정에서, 오차 (ei ) 크기에 따라 가우시안, 라플라스, 스튜던트-t가 각각 차지하는 상대적 기여도를 시각화한 것이다. 재구성 오차 (ei )에 따라 세 분포의 기여도가 자동으로 재조정된다.
-
중심 영역(ei가 작을 때): 가우시안과 라플라스가 세 밀한 복원 오류를 주도한다.( |ei |≤2)
-
중간 영역(ei가 중간일 때): 라플라스가 완충 역할을 하며 스튜던트-t로 서서히 주도권이 넘어간다. (2≤| ei |≤5)
-
꼬리 영역(ei가 클 때): 스튜던트-t가 지배적으로 작동 해 극단적 이상치에 강한 패널티를 부여한다. (|ei|>5)
이러한 기여도 변화는 이상 탐지에서 다양한 이상 유형 을 보다 유연하게 포착할 수 있게 한다.
3.5 Experimental Setup
총 3개의 도메인 데이터셋에 대해 여섯 종류의 손실 함 수 기반 오토인코더 모델을 각각 이상 탐지 성능을 비교하 였다.
각 손실 함수는 해당 분포에 기반한 손실 항으로 구성 되며, 평가 시에는 학습 방식과 일치하는 기준으로 이상 점수를 산출한다.
이상 탐지 성능 평가는 AUROC(Area Under Receiver Operating Characteristic Curve)와 AUPRC(Area Under the Precision-Recall Curve)를 사용하며, 각 실험은 5회 반복 측정 후 평균 ±표준편차 (AUC ±STD)기준으로 비교된다.
모델은 입력 x에 대한 복원값 을 생성하는 구조이며, 복원 오차에 대한 혼합 손실 함수를 최소화하도록 학습된다.
전체 실험설계는 <Table 1>과 같으며, 다음과 같이 구성 된다.
이러한 실험 설계를 기반으로, 제안한 손실 함수가 기존 손실 함수 대비 실제 이상 탐지 상황에서 유의미한 성능 향상을 보이는지를 검증하고자 한다. 특히, 복원기반 오토 인코더 구조 내에서 다양한 분포 기반 손실이 이상 탐지 성능에 미치는 영향을 비교함으로써, 단일 분포 기반 접근 방식의 한계를 실증적으로 분석하고자 한다. 이를 통해 제 안한 혼합 구조의 효과성을 평가한다.
4. Experiments
4.1 Performance Comparison across Loss Functions
실험 결과, 본 연구에서 제안한 혼합 손실 함수는 기존 손실 함수(평균제곱오차, 평균절대오차, 가우시안 음의 로 그 우도, 라플라스 음의 로그 우도, 스튜던트-t 음의 로그 우도)를 능가하며, 특히 불균형 환경에서 AUPRC 기준으 로도 일관되게 우수한 성능을 나타내었는데 그 결과는 <Table 2>와 <Figure 4>에 주어져 있다.
이는 분포 혼합(Mixture of Distributions) 및 꼬리 영역 집중(Tail sensitivity)이라는 두 메커니즘이 결합되어, 단일 분포 기반 손실 함수의 한계를 극복한 결과이다.
4.2 Distribution Contribution per Epoch
혼합 손실 함수는 학습 초기에 도메인 특성에 맞는 분 포를 빠르게 선택하며, 학습이 진행됨에 따라 정상/이상 구간의 잡음(Noise) 패턴에 적응하며 분포 기여도를 자동 조정한다.
각 도메인마다 주요 오차 유형에 맞춰 분포 기여도(πk) 가 빠르게 결정된다.
Injection Mold는 스튜던트-t 분포가 우세하며, Plastic Forming에서는 라플라스 분포의 기여도가 높게 나타난다. Heat Treatment에서는 스튜던트-t분포가 초기부터 주요 기 여도를 차지하며 우세한 역할을 수행한다.
Injection Mold는 정상 복원은 가우시안 분포, 극단 이상 치는 스튜던트-t분포가 설명하며, 두 분포 간 역할 분담이 안정적으로 유지된다. Plastic Forming은 라플라스 분포가 중간 수준의 노이즈를 지속적으로 설명하며, 학습 후반으 로 갈수록 가우시안 분포의 기여도도 점진적으로 증가하 는 경향을 보인다. Heat Treatment의 경우, 전체 학습 구간 에서 스튜던트-t 분포의 기여도가 지속적으로 높게 유지되 어, 해당 도메인의 복원 오차가 Heavy-tail 특성을 지닌다 는 점을 시사한다.
각 분포의 사용 비중을 자동으로 조정함으로써, 다양한 이상치 및 노이즈 분포에 유연하게 대응한다. 분포별 가중 치(πk)는 학습 데이터의 복원 오차 분포에 따라 동적 조정 되며, 별도의 수동 튜닝 없이 에폭(Epoch)별 변화에 적응 한다. 이러한 결과는 혼합 손실 함수가 초기 도메인별 주 요 노이즈 패턴을 포착하고, 이후 정상 및 꼬리 분포로 안 정화되는 과정이 명확히 관찰되었음을 보여준다.
에폭(Epoch)에 따른 각 분포의 기여도 변화는 <Figure 5>를 통해 확인할 수 있다.
결과적으로 혼합 손실 함수는 단일 손실 구조가 갖는 표현력의 한계를 극복하고, 다양한 도메인에 걸쳐 일관된 탐지 성능을 달성하였다.
5. Limitations and Future Work
5.1 Limitations
제안한 혼합 손실 함수는 다양한 확률 분포의 결합을 통해 이상 탐지 성능을 향상시키는 효과를 보였으나, 다음 과 같은 한계점이 존재한다.
5.1.1 모델 구조의 복잡도 증가
손실 함수는 세 가지 확률 분포(가우시안, 라플라스, 스 튜던트-t)를 동시에 포함하며, 각 분포의 고유 파라미터 (예: 표준편차 σ, 스케일 b, 자유도 υ 등)를 모두 학습해야 한다. 이로 인해 단일 분포 기반 손실 함수(평균제곱오차, 평균절대오차 등)와 비교했을 때, 학습 구조가 복잡해지고 연산 비용이 증가하는 단점이 존재한다.
5.1.2 분포 기여도 해석의 어려움
혼합 가중치(πk)는 소프트맥스 구조를 통해 학습되며, 각 분포의 음의 로그 우도는 복원 오차 ei에 따라 동적으 로 결합된다. 이러한 구조는 학습 과정 중 각 분포의 기여 도가 시시각각 변하는 특성을 가지며, 정량적 해석을 어렵 게 만든다. 특히 스튜던트-t분포의 자유도 υ 및 스케일 σ 는 직관적인 해석이 어려운 파라미터이며, 최적화 과정에 서 수치적 불안정성이 발생할 가능성도 존재한다.
5.1.3 도메인 특성에 따른 해석 한계
세 가지 산업 도메인에 대해 모델의 이상 탐지 성능을 비교하였으나, 각 도메인의 데이터 특성과 복원 오차 분포 간의 정량적 관계 해석은 본문에서 다루지 않았다. 이상치의 분포적 특성(Heavy-tail, asymmetry 등)과 분포 구성 간의 정합성(AIC/BIC 등)을 분석할 경우, 제안 기법의 표현력과 도메인 적응력에 대한 보다 구체적인 해석이 가능할 것이다.
5.2 Future Work
본 연구는 다음과 같은 방향으로 확장 및 개선될 수 있다.
5.2.1 다양한 도메인 확장 및 오픈소스화
현재 실험은 제조 분야의 데이터셋을 중심으로 수행되 었으나, 향후 금융, 보안, 의료 등 다양한 응용 도메인에 본 구조를 적용할 계획이다. 또한 학습 파이프라인 및 전 체 코드 베이스를 정리․공개함으로써, 재현성과 활용도 를 동시에 강화할 예정이다.
5.2.2 새로운 손실 함수 방향 확장
현재의 구조는 꼬리(tail) 구간에 대한 민감도를 반영하 되, 아직 완전한 비정규성 또는 비대칭성을 반영하지는 못 한다. 향후 연구에서는 꼬리 기반 가중 손실을 더욱 일반 화하여, 왜도(skewness) 및 첨도(kurtosis)와 같은 고차 통 계량을 반영한 로버스트 비대칭 손실 함수를 설계할 예정 이다. 이를 통해 다양한 이상 탐지 시나리오에서의 범용성 과 성능 향상을 동시에 추구할 수 있을 것으로 기대된다.
5.2.3 정량적 분포 적합성 및 도메인 연계 해석
후속 연구에서는 각 분포 조합에 대해 복원 오차의 분 포 특성과 통계적 적합도(AIC, BIC 등)를 정량적으로 분 석할 계획이다. 이를 통해 손실 함수의 구성 논리를 이론 적으로 보완하고, 실제 데이터 환경에 따른 적응력 향상 여부도 체계적으로 검증할 수 있을 것으로 본다. 추가적으 로, 실험 반복성과 모델의 강건성을 평가하기 위해 신뢰구 간, 분산 분석 등을 병행하여 모델의 실용성과 일반화 가 능성을 함께 점검할 예정이다.