1. 서 론
4차산업혁명의 핵심 기술 중 하나인 머신러닝은 설비 의 고장 진단[3], 스마트홈[5], 스마트공장 등 다양한 곳 에 적용되고 있다. 또한, 스마트제조가 확산됨에 따라 제 조시스템은 자동화를 넘어 머신러닝을 활용한 스마트화 로 나아가고 있다. 특히, 기존의 자동가공에서는 공구파 손이나 심한 마모로 인해 가공불량, 미가공이 다수 발생 하여 생산성이 감소되고, 품질불량률이 상승하고 있다. 그러므로 공구수명을 측정하고 예측하는 것은 중요하다.
공구수명은 광학적 측정, 마멸면 화상 인식, 전기저항 변화 및 센서 등을 이용하여 측정할 수 있다.
간접적으로는 절삭력, 동력, 음향, 절삭온도 측정, 가 공물의 표면 거칠기 등을 통해 공구마모를 측정할 수 있 다. 공구마모에 영향을 미치는 공구인자로는 절삭공구재 료, 공구 형상 등이 있고, 가공인자로는 절삭속도, 절삭 깊이, 이송속도 등이 있고, 가공물 관련인자로는 가공물 경도, 열전달 계수 등이 있다[7].
공구마모를 예측하기 위해 공구수명식이 사용되었는 데, 공구수명식은 다양한 환경변수에 따른 공구수명을 예측하는데 어려움이 있다. Taylor[12]가 제안한 공구수 명식은 다음과 같다.
여기서 v는 절삭속도, T는 공구수명, n은 공구재료에 의한 상수, C는 공구를 통한 작업에 의해 생성되는 상수이다.
Kong[7]은 정상상태 공구마모영역 내에서는 공구마모 와 가공시간은 1차함수와 유사하다는데 착안하여 다음 의 수정된 공구수명식을 제안하였다.
여기서 p, q, a, b 는 실험조건에 따라 구해야 하는 파라미 터들이며, w는 공구마모량이다. 실험에서 Taylor의 공구 수명식은 오차율이 20~34% 정도인데 반해 제안한 공구 수명식은 2.2~3.3%의 오차율을 보였다. 한편 Kang[4]은 다음의 수명식을 제안하였다.
여기서 d는 절삭깊이, f는 이송속도를 의미한다.
Özel and Karpat[9]는 공구마모로 플랭크마모를 예측 하기 위한 식으로 다음 식을 제안하였다.
여기서, H는 작업물 경도(workpiece hardness), f는 이송 률(feed rate), υ는 절삭속도(cutting speed), E는 공구의 선단반경(edge radius of the CBN(Cubic Boron Nitride) tool(μm)), C는 CBN의 함유백분률(CBN content in percentage volume), L은 축방향 절삭길이(cutting length in axial direction(mm))이다. 위 식은 로그함수를 취하면 다 중선형회귀식으로 표현할 수 있다.
제조현장에서는 공구수명식을 이용하거나 경험에 의해 가공횟수나 가공시간을 미리 정해두고 마모가 심해지거 나 파손되기 전에 미리 공구를 교체하는 예방보전(preventive maintenance)을 활용해 왔다. 하지만, 정해진 횟수나 가공시간은 정확하지 않기에 공구마모가 심해지기 전에 교체된다거나 혹은 이전에 파손되는 경우가 발생한다.
센서 기술이 발전하고 많은 양의 데이터를 분석할 수 있는 인공지능기술이 발전함에 따라 예지보전(predictive maintenance)이 각광을 받고 있다. 센서들로부터 오는 데 이터들을 실시간으로 분석하여 공구파손을 예측하고 사 전에 조치하는 것에 대한 연구들이 활발하다. Wu et al. [13]은 공구마모에 대한 예측을 위해 Random Forest, SVR (Support Vector Regression), ANN(Artificial Neural Network) 등의 다양한 기계학습기법(Machine Learning)을 적용하 였다. Xu et al.[14]은 대량생산하는 경우 공구파손 예측 하기 위해 SVR에 기초한 ICSSVM(An incremental costsensitive support vector machine) 이라는 기법을 제안하 였다. 이들은 생산 초기에는 공구파손에 대한 자료가 부족 하므로 시뮬레이션을 이용하여 공구파손의 특성을 가진 데이터를 생성하여 예측에 활용하였다. Kong[6]은 공구 마모 예측에 GPR(Gaussian Process Regression이라는 해 법을 적용하고, 기존의 ANN, SVM과 비교하고 정확도 면에서 GPR이 더 좋은 결과를 보여준다고 하였다. 이들 은 노이즈가 결과에 나쁜 영향을 미치므로 노이즈를 제 거하는 기법을 함께 제안하였다. Pandiyan et al.[10]은 유 연한 연마벨트를 이용한 연삭공정에서 실시간으로 공구 상태를 파악하기 위해 SVR과 GA(Genetic Alogorithm)를 이용하였다. 이들은 GA를 이용하여 결과에 많은 영향을 미치는 특징(feature)을 추출하였다.
본 논문에서는 공구수명예측을 위해 기계학습기법 중 하나인 SVR을 적용하고자 한다. SVR은 실제값과 예측값 의 차이가 설정된 오차값(∈) 이내라면 벌점을 부가하지 않 고 이를 벗어나면 차이 나는 거리에 비례하여 벌점을 부가 하는 기법이다[1]. 기존의 SVR은 예측값이 실제값 보다 크든 작든 간에 차이 나는 거리에만 비례하여 벌점을 부가 하는 대칭적인 방법이다. Lee and Choi[8]는 SVR에 벌점을 받지 않는 오차값 이내인 ∈-tube의 비대칭성과 ∈-tube를 벗어 나는 데이터들에 대한 벌점의 비대칭성을 고려한 GSVQR (Generalized Support Quantile Regression)을 제안하였다.
Schölkopf et al.[11]은 ν-SVR을 제안하였는데, ∈-tube 이내에 들어오는 데이터 수의 비율을 ν로 조절할 수 있다. Huang et al.[2]은 ∈-tube를 벗어나는 데이터들에 대한 벌 점의 비대칭성을 고려한 비대칭적 ν-SVR을 제안하였다. 본 논문에서는 Lee and Choi[6]처럼 ∈-tube의 비대칭성과 ∈-tube를 벗어나는 데이터들에 대한 벌점의 비대칭성을 고 려하는 것을 ν-SVR에 적용한 ν-ASVR(ν-Asymmetric Support Vector Regression)을 제안하고 공구마모 예측 문제에 적용하였다. 공구마모의 경우에는 공구마모량의 예측값이 실제값보다 작으면(과소예측), 공구파손이나 마모로 인해 제품불량을 초래할 수 있다. 그러므로, 과대예측하는 것 이 필요하기에 ν-ASVR이 적합하다고 할 수 있다. 또한, ∈-tube의 비대칭성과 ∈-tube를 벗어나는 데이터들에 대한 벌점의 비대칭성을 조절하는 경우에도 ν로 ∈-tube 이내 에 들어오는 데이터 수의 비율을 조절할 수 있음을 보여 주었다.
2. 기존의 ν-SVR과 비대칭적 ν-SVR
ν-SVR의 수학모형은 P1과 같다.
여기서 은 데이터이며 L∈ (u)는 ∈-둔감함수로 아래와 같다.
Schölkopf et al.[11]는 P1문제의 최적해는 다음을 만족한 다는 것을 증명하였다.
여기서 l (a)는 a가 참이면 1 아니면 0인 지시함수(indicator function)이다. 즉, 제약식은 전체 데이터수가 n개일 때 데이터의 일정비율((1 - ν)n) 이상이 ∈-둔감함수 이내 에 있다는 것을 증명한 것이다.
비대칭적 ν-SVR[2]의 ∈-둔감함수((u) )는 다음과 같다.
이때의 수학모형은 P2와 같다.
여기서 ϕ(x)는 선형추정이 불가능한 현재 공간의 분포 를 선형추정이 가능하도록 한 차원 높은 공간으로 변환 하기 위해 x→ϕ(x)로 설정한 것이다.
3. 제안하는 ν-ASVR
비대칭적 ν-SVR[2]의 ∈-둔감함수((u) )에서는 좌우 손 실값의 비대칭성은 p를 이용하여 고려하였지만, 좌우폭의 비대칭성은 고려하지 않았다. 본 논문에서는 ∈-tube의 좌 우폭의 비대칭성을 위한 p1과 좌우 손실값의 비대칭성을 위한 p2를 이용하여 손실함수를 제안하였다. 오차의 좌우 폭을 2∈라고 할 때의 손실함수는 다음과 같다.
∈-둔감함수에서 u로 입력되는 값이 이므 로 이다.
동일한 방법으로
그러므로 제안하는 손실함수 에 적합한 ν-ASVR 의 원문제는 P3로 나타낼 수 있다.
P3를 라그랑주 승수법을 이용하여 표현하면 다음과 같다.
는 라그랑주 승수(Lagrangian multiplier)로 비 음조건을 만족해야 한다.
최적해가 되기 위해서는 1차 필요조건을 만족해야 한 다. 즉, L을 편미분하여 0으로 두면 다음과 같다.
식 (3)에 의해
식 (2)에서 ζ ≥ 0이므로
양변에 δ를 곱해주고, λi = δαi , 로 두면
이다.
식 (1)~식 (5)를 이용하여 P3를 라그랑주 쌍대 문제 (DL)로 나타내면 다음과 같다.
이때 는 커널(kernel)로 변환 함수(ϕ(x) )끼리 스 칼라곱인 들을 모아놓은 집합이다.
DL을 풀어 의 최적해를 구한다. 이후 편의항 b와 두께 ∈를 구하는 방법은 다음과 같다.
이므로 이를 대입하여 정리하면 인 i를 찾는다. 이 데이터 i는 상한의 경계 (support vector)에 있는 데이터이므로 식 (6)을 만족한다.
또한, 인 i를 찾는다. 이 데이터 i는 하 한의 경계(support vector)에 있는 데이터이므로 식 (7)을 만족한다.
식 (6)과 식 (7)을 이용하여 b, ∈를 구할 수 있다.
Huang et al.[2]은 비대칭적 ν-SVR에서 ∈-tube에 속하 는 데이터의 개수를 ν를 이용하여 결정할 수 있으며, 매 개변수 p에 의해 ∈-tube에 포함되는 데이터의 비대칭적 인 개수가 결정된다는 것을 증명하였다. 본 논문에서는 추가적으로 제시한 P3도 데이터의 개수를 ν를 이용하여 결정할 수 있으며, p1에 의해 ∈-tube의 비대칭 폭이 결정 되며 p2에 의해 ∈-tube에 포함되는 데이터의 비대칭적인 개수가 결정된다는 것이다. Huang et al.[2]과 동일한 절 차로 증명하면 다음과 같다.
Proposition 1. P3의 최적해는 다음을 만족한다.
증명) ζ ≥ 0이므로 식 (2)는
그러므로,
∈-tube를 위로 벗어나는 데이터들은 이며 ξi > 0이다. 상보여유정리에 의해, ξi > 0 이면 ηi = 0이다. 식 (4)에 의해 이므로 이다.
다시 요약하면 ∈-tube를 위로 벗어나는 데이터들은 이며, 그렇지 않으면 αi = 0이다. 그러므로, ∈-tube 를 위로 벗어나는 데이터들의 수가 p2νn보다 많다면
이 성립하여야 하는데 이것은 식 (8)을 위반한다. 그러므로 식 (9)는 성립한다.
∈-tube를 아래로 벗어나는 데이터들은 이며 이다. 상보여유정리에 의해, 이면 이다. 식 (4)에 의해 이므로 이다.
다시 요약하면 ∈-tube를 아래로 벗어나는 데이터들은 이며, 그렇지 않으면 이다. 그러므로, ∈-tube를 아래로 벗어나는 데이터들의 수가 (1 - p2 )νn보 다 많다면
이 성립하여야 하는데 이것은 식 (8)을 위반한다.
그러므로 식 (10)은 성립한다.
식 (9)와 식 (10)에 의해 식 (11)은 성립한다.
식 (11)은 ν(0 ≤ ν ≤ 1)로 ∈-tube에 속하는 데이터의 수를 조절할 수 있다. 이때 ∈은 수학모형 P3에서 의사결 정변수로 구해야 하는 값이며, p1은 조절 가능한 변수로 ∈-tube의 폭의 비대칭성을 조절할 수 있다. 예를 들면, ν = 0.3이라면 전체 데이터의 70% 이상이 ∈-tube내에 존재 한다. 또한, p1 = 0.1이라면 ∈-tube의 전체 폭이 2∈일 때 아래쪽으로는 1.9∈, 위쪽으로는 0.1∈의 비대칭적인 폭을 가지는 ∈-tube가 된다. 그러므로, 수학모형 P3는 이러한 비대칭적인 ∈-tube내에 데이터의 70% 이상이 존재하는 ∈ 과 ∈-tube를 구하는 모형이다.
4. 실 험
본 연구에서는 3축 고속 CNC 기계(Röders Tech RFM 760)가 사용되었다. 공구로는 밀링 커터가 사용되었으며, 가공 후 공구마모를 측정한 데이터를 사용하였다[13]. CNC 기계의 테이블에 장착된 고정식 동력계(stationary dynamometer) 를 사용하여 x,y,z축의 절삭력(cutting force)이 측정 되었다. 또한, 공작물에 장착된 3개의 압전 가속도계(piezo accelerometers)로 x,y,z축의 진동이 측정되었다. 공작물에 장착된 음향방출센서(accoustic emission sensor)로 고주파 진동이 모니터링 되었다. 각 절단 테스트 후 공구 마모값은 현미경(Leica MZ12)을 사용하여 오프라인으로 측정되었다.
한 번 가공할 때마다 x차원에서의 힘, y차원에서의 힘, z차원에서의 힘, x차원에서의 진동, y차원에서의 진동, z차 원에서의 진동, 음향방출(acoustic emission)의 7개의 신호 채널(signal channel)로 부터의 값들이 10,000번 이상(50kHz/ channel) 측정된다. 945번의 가공이 이루어졌으며 각각의 가공 후에 공구의 마모상태를 3군데(flute 1, flute 2, flute 3)에서 측정되었다. 이때 가공되는 소재는 스테인레스 강 (Stainless Steel)이며, 주축의 속도는 10,400rpm, 투입률 (feed rate)은 1,555mm/min, Y축으로의 깊이는 0.125mm이 며, z축으로의 깊이는 0.2mm이다. 7개의 신호채널로부터 4개의 변수들이 각각 추출되어 총 28개의 변수들이 사용 되었는데 <Table 1>과 같다.
총 데이터의 70%는 훈련데이터(training data)로 30%는 검증데이터(Validation data)로 사용하였다. 공구의 마모값 MAX(flute 1, flute 2, flute 3 중에서 최대마모값)를 반응변 수로 고려하였다.
고려하는 커널함수(kernel function)와 파일롯 실험을 통 해 구한 커널 별 최적 매개변수 값은 <Table 2>와 같다.
제안한 ν-ASVR은 Cichosz[1]가 R로 작성한 SVR 코드 를 수정하여 구현하였다.
실험에 이용한 매개변수 p1, p2, ν는 다음과 같이 설정 하였다.
-
∙과대예측을 위해 p1 = 0, 0.5, 1로 설정하였다. 0 ≤ p1 < 1이면 ∈-tube의 아래쪽 tube에 많은 데이터가 속하게 하는 것이고, 1 < p1 ≤ 2인 경우에는 ∈-tube의 위쪽 tube에 많은 데이터를 속하게 하는 것이다.
-
∙모든 상황을 고려하기 위해 p2 = 0.1, 0.5, 0.9로 설정하 였다. p2 = 0.5이면 ∈-tube를 벗어나는 데이터들은 위나 아래를 벗어나는 것에는 무관하게 거리에만 비례하여 벌점을 부여한다. 0 ≤ p2 < 0.5인 경우에는 ∈-tube의 위 쪽으로 벗어나면 많은 벌점을 부여하며, 0.5 < p2 < 1인 경우에는 ∈-tube의 아래쪽으로 벗어나면 많은 벌점을 부 여한다.
-
∙ν = 0.3으로 설정하였다. 즉, 데이터의 70% 이상은 ∈- tube 내에 존재하도록 하였다.
실행한 결과는 <Table 3>과 같다.
결과를 요약하면 다음과 같다.
-
∙정확도는 RMSE, MAE, MAPE로 이용하여 비교하였 다. 로 계산하였으며, n은 데 이터의 개수, yi는 i번째 데이터의 실제값, 는 i번째 데이터의 예측값이다.
-
∙커널에 따라 정확도를 비교해보면 모든 경우에 RBF 커널을 이용한 예측이 가장 좋은 정확도를 보였으며, 다음으로는 Polynomial, Linear, Sigmoid의 순이다.
-
∙당연하게도, p1 = 1일 때인 ∈-tube의 아래, 위 폭이 동 일한 경우의 결과가 모든 커널에 대해 가장 좋은 정확 도를 보여주었다.
-
∙p1의 값이 작을수록, 즉 ∈-tube의 아래폭이 크고 위 폭 이 작을수록 정확도는 나빠졌다.
-
∙폭을 결정하는 ∈은 RBF 커널이 가장 작았으며 다음으 로는 Polynomial, Linear, Sigmoid의 순으로 커졌다. 이 는 정확도의 결과와 동일한 순서이다.
-
∙p1 = 1, p2 = 0.5일 때는 Huang et al.[2]의 비대칭적 ν- SVR과 동일하다.
-
∙p1은 정확도에 큰 영향을 미쳤으며, p2는 정확도에 미 치는 영향이 작았다.
선형 커널과 RBF의 결과에 대한 그래프가 <Figure 1>, <Figure 2>에 각각 주어져 있다. 가로축은 가공순서에 따 라 index를 부여한 것이고 세로축은 마모량을 의미한다. 즉, 빨간 점은 실제 데이터(yi )를 나타내며, 파란색 실선 은 예측값들을 실선으로 연결한 것이다. 총 945번의 가공 중 30%가 무작위로 추출되어 검증데이터로 사용되었다.
선형 커널의 경우에 가로축은 단순히 순서를 의미하 므로 예측값은 직선으로 표현되지는 않는다. 흥미로운 점은 예측값이 꾸준히 증가하는 추세이지만, 일부 지점 에서는 일시적으로 감소하는데, 그 이유는 다음과 같다. 1번 가공할 때마다 x, y, z차원에서의 힘 x, y, z차원에서의 진동, 음향방출에 대한 7개의 신호채널로부터의 값들이 10,000번 이상 측정되기에 <Table 1>에서 언급하였듯이 평균(mean), 중앙값(median), 표준편차(standard deviation), 최대값(max)만을 추출하여 공구마모량을 예측하는데 사용 하였다. 이 중 표준편차나 최대값이 가공순서가 증가하 여도 일부 구간에서는 오히려 소폭 감소하는 경우가 발 생하는데 이로 인해 예측값이 일부 구간에서는 소폭 감 소한다.
<Figure 1(a)>와 <Figure 2(a)>를 보면 p1 = 0일 때를 나 타내는데, ∈-tube의 아래쪽 tube에 많은 데이터가 속하도록 비대칭적으로 ∈-tube 설정한 것으로 파란색 실선이 빨간 색 점 보다 위에 위치한다. 이는 실제값보다 공구마모량을 과대예측한 것을 의미하며 본 연구의 목적대로 보수적인 결정을 하는데 유리하다. <Figure 1(b)>, <Figure 1(c)>와 <Figure 2(b)>, <Figure 2(c)>에서는 p1 = 1로 ∈-tube의 아 래 위 폭이 동일한 중립적인 예측으로 파란색 실선이 빨간 색 점의 아래에 있는 경우도 자주 보이는데 이는 공구마모 량을 과소예측하는 것으로 공구파손이나 가공불량 등을 초래할 수 있으므로 바람직하지 않은 것을 의미한다. 또 한, 본 실험에서는 p2의 값은 결과에 큰 영향을 미치지 않 는 것으로 보인다.
5. 결 론
스마트제조가 산업현장에 확산됨에 따라 기존의 공구 수명식을 이용한 예측을 대신하여 센서를 통해 데이터를 수집하고 수집된 데이터를 이용하여 공구수명을 예측할 수 있게 되었다. 본 연구에서는 기계학습 기법 중 하나인 SVR을 이용하였는데 공구수명은 과소예측하는 것보다 는 과대예측하는 것이 품질불량감소와 공구파손으로 인 한 생산율 저하를 예방할 수 있다는데 착안하여 비선형 적인 SVR을 적용하였다. 특히 ∈-tube의 폭의 비대칭성과 ∈-tube를 벗어나는 데이터들에 대한 벌점의 비대칭성을 고려한 ν-ASVR을 제안하고 공구마모를 예측하기 위해 적용하였다.
또한, ∈-tube의 비대칭성을조절하는 p1과 ∈-tube를 벗 어나는 데이터들에 대한 벌점의 비대칭성을 조절하는 p2 를 이용하여 ∈-tube의 아래 위 폭에 속하는 데이터 수의 비대칭성을 조절할 수 있으며, ν로 ∈-tube 이내에 들어오 는 데이터 개수의 비율을 조절할 수 있음을 증명하였다.
실험을 통해 제안한 ν-ASVR은 p1과 p2를 이용하여 공구마모를 과대예측할 수 있음을 보여주었다. 또한, 실 험의 예에서는 ∈-tube의 폭의 비대칭성을 결정하는 p1이 벌금의 비대칭성을 결정하는 p2보다 과대예측의 정도와 정확도에 더 큰 영향을 미쳤다.
미래의 연구과제로는 다른 기계학습 기법을 이용하여 공구마모를 과대예측 할 수 있도록 하는 것과 ν-ASVR 을 다른 데이터에도 적용하여 p1과 p2가 과대 혹은 과소 예측의 정도와 정확도에 미치는 영향에 대해 살펴보는 것도 필요하다고 하겠다.