1. 서 론
세계 주요국 정부는 객관적인 증거에 기반한(Evidence- Based) 혁신측량체계(Metric for Innovation)를 구축하고 고 도화 중이다. 정책현장의 실제 사례로서, 미국 백악관 산하 과학기술정책실(Office of Science and Technology Policy)은 정부의 연구개발투자가 창출하는 혁신을 모니터링 하기 위 한 STAR METRICS(Science and Technology for America’s Reinvestment: Measuring the EffecT of Research on Innovation, Competitiveness and Science) 프레임워크의 개발을 주 도하였다[35-36, 40]. 또한 유럽연합정부(European Commission, 이하 EC)의 산하기관인 JRC(Joint Research Centre) 는 FP(Framework Programmes) 8~9의 기술산업화 정책을 지원하기 위한 증거기반 시스템 KETs Observatory(Key Enabling Technologies Observatory)과 ATI(Advanced Technologies for Industry)의 구축을 주도하였다[10-12, 40]. 대한 민국정부 역시 위 소개한 미국 및 유럽 사례에 비견되는 데이터 기반의 정책지원체계 R&D PIE(R&D Platform for Investment and Evaluation)를 구축 후 고도화 중이다[19, 41-45, 50].
최근 유럽연합정부는 정책, 법, 제도, 윤리, 산업 등 포괄 적인 영역에서 AI(Artificial Intelligence) 기술의 활용을 촉 진하기 위한 가이드라인 문서 및 법안들[13-18]을 공개하고 있다. AI 기술의 활용을 확대하기 위한 본 문헌들은 HAI(Human-Centric Artificial Intelligence) 개념에 기반하여 개발되었다. 이러한 시대 흐름을 반영하여 유럽과 미국의 연구기관, 대학 및 글로벌 IT 솔루션 기업들은 HAI 컨셉의 연구결과 및 분석플랫폼을 공개하고 있다[14, 30, 55]. 정책 분야를 포함한 광범위한 영역에서, 분석자의 전문성과 AI 시스템의 객관성을 융합한 Human-AI 협업 프로세스가 주 목을 받고 있다.
정부부처들은 혁신정책 수립 등의 정부정책 기획 과정에 서 산학연 기관들에게 분석을 의뢰하거나, 전문가 자문단에 게 의견수렴을 요청하는 사례들이 많다. 최근 정부부처들은 그들이 의뢰한 데이터분석의 결과, 혹은 전문가 자문단의 의견수렴 과정이 보다 설명 가능할 것을 업무 수행자들에게 요구하고 있다. 본 연구는 정부의 연구개발 투자배분 과정 을 지원하기 위해 개발된 데이터분석체계 R&D PIE가 정책 현장에 활용된 일부 사례를 연구용으로 재정리하였다. 분석 자가 AI의 도움을 받거나 혹은 AI-전문가 협업 프로세스를 통해 정부기관들의 분석수요에 대응한 사례를 참고하여, 그 한계 상황들을 재현하고 보완하는 연구를 수행하였다. 본 모델연구를 통해, 향후 유사한 정부부처의 분석수요에 대응 가능한 Human-AI 협업 프로세스 발전에 기여한다.
2. 선행연구
유럽연합정부는 AI가 활용되는 분야 전반에 대한 법 제도 프레임을 HAI 컨셉에 의해 개발하여 대중들에게 공개하고 있다[13-18]. 본 법안과 문헌의 주요 내용은, 향 후 AI를 활용하여 얻어진 결과물들이 추적가능(Traceability) 하고 설명가능(Transparency/Explainability)한 정 보를 제시할 수 있어야 한다는 것을 명시하고 있다. 즉, AI가 포함된 정책지원용 데이터분석체계 역시 HAI 기반 의 제도가 요구하는 추적가능 하고 설명가능한 기준들을 만족시키기 위한 연구들이 필요하다.
유럽연합정부를 포함한 세계 각국 정부들은 AI 제도화를 준비 중에 있으며, 이에 글로벌 IT 업체 및 학계에서는 HAI 기반의 분석솔루션을 공개하고 또한 유관 학과를 개설하고 있다. 예로서 IBM사는 자사의 홈페이지를 통해 HAI 분석 솔루션을 홍보하고 있으며, 이를 Human-AI 협력체계 (Collaboration Between Humans and AI Systems)[30]로 설명 하고 있다. Stanford 대학은 산하 HAI 센터를 통해 HAI를 “Integration of AI Across Human-Centered Systems”[55]로 설명하고 있다. 또한 HAI System에 관한 연구결과들[4-5, 21, 26-27, 33-34, 37]이 의학, 제도, 윤리, IoT, 경영을 포함한 다양한 분야에서 보고되고 있다. 위 예시된 논문들이 제시 하는 Human-AI 협업 시스템은 AI가 객관적인 수치를 제공 하여, 분석자 혹은 전문가단이 판단을 내리는 과정을 지원 할 수 있도록 설계되어 있다.
한편 대한민국 정부부처들은 산학연 기관들에 분석을 의뢰하며, 위 소개한 Human-AI 협업과 같은 방법론을 통해 그 결과 도출과정이 보다 설명 가능할 것을 분석기관들에게 요구하고 있다. 예로서 대한민국정부의 연구개발투자 배분 을 총괄하는 과학기술혁신본부는, 국가의 연구개발DB에 기반하여 투자현황을 분석하고 또한 평가․기획 업무를 지 원하는 데이터기반 시스템 R&D PIE의 구축을 주도하였다. R&D PIE 분석 활동에는 기존에 존재하지 않았던 기술분류 기준을 수립하고 또한 분석하는 업무들이 포함된다. 이의 한 예로서, 국가의 연구개발투자 DB의 text 정보를 LDA(Latent Dirichlet Allocation) 토픽분석을 통해 분류한 후, 전문가 자문단이 본 분류결과를 검토․수정 하는 기술 분류작업을 수행한 사례가 있다. 본 업무수행 과정 중, 적정 한 LDA 토픽수를 추정하고 또한 토픽간의 변별력을 분석하 는 과정 중 다양한 한계점들이 파악되었다. 본 연구논문은 위 예시된 현장분석의 한계 상황들, 그리고 이와 유사한 학계의 선행연구 결과들을 다수 참고하여 이를 개선하기 위한 대안적인 방법론을 탐색하였다. 보다 세부적으로 그동 안 학계에서 발표되어 온 LDA(Latent Dirichlet Allocation) 연구결과들[2, 22, 28, 31, 38-39, 52, 54, 56-57], 그리고 LDA 에 기반한 Human-AI 협력체계 HITL(Human-In-The-Loop) 시스템의 연구결과들[28, 38-39, 54]을 다수 참고하였다. 본 연구는 기 공개된 LDA 연구들, 혹은 LDA 기반의 AI-자문 단 협력 프로세스에 XAI(Explainable AI) 역 해석 기법을 적용하였다. XAI 기법을 활용하여 LDA 기반의 분석과정을 역 추적할 수 있고, 또한 그 과정에 설명력을 강화할 수 있는 방법론을 연구하였다.
3. 연구방법
본 연구에서 제안하는 데이터 획득과정, LDA 모델링, XAI 역 해석, 그리고 동시출현 네트워크 생성․재조합 과정을 <Figure 1>에 요약하였다. 본 논문의 모든 분석과 정들은 Knime Data Analysis Platform[41-45]을 통해 구 현하였다.
3.1 분석 데이터
본 모델연구에 사용되는 NTIS(National Science & Technology Information Service, 이하 NTIS) DB의 전처 리 과정을 <Figure 1>에 요약하여 있다. 보다 세부적인 데이터마이닝 과정은 유관한 선행연구들을 통해 구축된, NTIS DB 내장 전처리 자동화 연구결과들[41-45]에 정리 되어 있다. 참고로 선행연구들의[41-45] 전처리 자동화 결과들을 재사용한다는 것은, 본 연구에 사용되는 데이 터들이 정부의 연구개발투자․성과를 분석하는 조사분 석평가서의 작성기준을 준용하여 마이닝 되었음을 의미 한다.
본 분석에 사용되는 데이터는 NTIS DB 중에서도 국가조 사분석평가 절차를 마친 가장 최신의 원시DB[연구개발투 자 2010~2020년(613,205건), 그리고 사업화성과 2016~2020 년(148,900건)][49]로 부터 마이닝 되었다. 보다 세부적으 로, 본 사례연구의 데이터는 한국 해양수산업 지원․육성을 책임지는 해양수산부의 가장 최신 2016~2020년 사업화 성 과들을 NTIS DB로 부터 마이닝 하였다. 참고로 본 연구에 서 사용하는 DB 마이닝 체계는 대한민국 정부의 연구개발 투자성과 원시DB를 내장하고 있기 때문에, 해양수산부 사 례 외에도 유사한 분석에 범용적으로 활용 가능하다. NTIS DB의 재조합 체계를 통해 “해양수산부” 이름으로 수행된 7,819건의 연구개발투자 실적이 집계되었으며, 본 연구과 제들을 통해 2016~2020년간 총 350건의 사업화 실적이 집 계되었다. 위 7,819건의 연구개발투자 정보와 350건의 사업 화 실적들과 연계된 다양한 정보들(연구개발DB중 국문과 제명, 키워드, 6T 분류 필드; 사업화DB중 유발 매출액, 사업 화설명 필드)은 이하 분석과정 중 자동으로 추출․정제․재 조합 되었다. 위 설명한 사업화 관련 텍스트 정보들은 기계 학습을 위한 입력자료(총 1,455개의 Bag-of-Word 컬럼), 혹 은 동시출현 네트워크를 구성하기 위한 정보로 변환된다. LDA 토픽모델링에 의한 인공지능 추론 결과는, 동시출현 네트워크로 부터 도출된 증거기반(Evidence-Based) 정보와 재 마이닝 과정을 통해 추론-증거 상호 보완적인 분석결과 를 도출하는데 사용하였다.
3.2 LDA 토픽모델링
LDA 토픽모델링은 사전에 답지가 부재한 문헌을 분 류하는데 유용한 비지도학습(Unsupervised) 모형으로, 현 재까지도 연구용 및 현장용 분석에서 널리 사용되고 있 다. 기 발표된 선행연구들 중에는 LDA 토픽모델링을 통 해 합리적인 토픽수를 추정하는 과정에 한계점들이 있음 을 보고하는 사례들이 파악된다. 예로서 Perplexity 최소 화는 LDA 토픽수를 추정하는 대표적인 방법론으로, 계 산된 perplexity 최소점에 해당하는 토픽수를 최적점으로 채택한다. Park et al.[51]은 perplexity를 “토픽모델링에 의한 우도(likelihood)가 토픽수 변화에 따라 학습이 잘 되었는가를 나타내는 척도”로 설명하고 있다. 그러나 본 연구논문의 분석결과를 포함한 참고문헌 들은[2, 31, 52], perplexity 토픽수 최적화 기법의 결과가 단조 감소추세 를 보이는 사례들을 보고하고 있다. Perplexity 단조감소 로 인해 최적 토픽수를 추정하기 어려운 경우, 분석자는 그 판단을 보조할 근거가 희박함에도 불구하고 경험적 혹은 자의적으로 토픽수를 결정할 수밖에 없다.
또한 LDA 토픽모델의 현장 응용 예로서, LDA 분석결과 를 전문가 자문단이 평가 후 개선안을 반영하는 Human-AI 협력프로세스 HITL 연구들이 파악된다[28, 38-39, 54]. 분석 자는 전문가단의 수정안을 반영하여 문헌에 단어를 추가 (add), 삭제(remove), 변환(replace), 통합(merge) 한다. 불필 요한 문헌을 삭제(remove documents) 하거나, 필요에 따라 추가(add documents) 한다. 또한 도출된 토픽을 전문가들의 조언에 따라 분할(split), 병합(merge), 삭제(remove) 할 수 있다. 위 예시한 전문가 자문단의 의견을 반영할 경우 역시, 업데이트된 분류의 정확도 및 분류간 변별력을 정량화 할 수 있는 보조수단을 필요로 한다. 본 논문은 LDA의 perplexity 토픽수 최적화 기법만으로 해결하기 어려운 예외 사례들에 대응할 수 있고, 또한 LDA-분석자 협업 프로세스 를 통해 도출된 결과물들을 정량적으로 재평가할 수 있는 대안으로 LDA-XAI 연계 분석법을 탐색연구 하였다. 적용 된 XAI 기법에 대한 세부 내용은 제3.3절에 상술하였다.
LDA 기법은 분석자가 토픽수 K, 그리고 디클레분포 파라미터 α와 β를 선택하여야 한다. 본 연구는 Naili et al.[47]의 논문이 리뷰한 다양한 파라미터 설정 연구결과 들을 참고하고, Steyver et al.[22, 56]의 권고치인 α (50/K) 및 β(0.01)를 사용하였다.
3.3 기계학습 및 해석 방법론
한편 인공지능의 추론결과를 역 해석하기 위한 다양한 XAI 방법론들[1, 3, 5-9, 21, 23-25, 29, 32, 44, 46]이 소개되 고 있으며, HAI 프로세스에 XAI 기술이 도입된 연구결과들 도 보고되고 있다[21, 53]. XAI 기술은 Black-Box로 표현되 는 기계학습의 결과를 해석력(Interpretability)을 가진 이종 모델들을 통해 역 해석하는 방법론이다. 본 연구는 다양한 XAI 기법 중 현실적인 시간과 활용자원 내에서 적용이 용이 한 Model-Agnostic[3, 25] 기반의 대리분석(Surrogate)[1, 6, 24, 44, 46] 모형들을 사용하였다.
<Figure 2>에 예시한 Model-Agnostic 기반의 XAI 기법은 사용되는 기계학습 모형간 종류에 구애받지 않고 상호 연계 할 수 있다는 유연함과 범용성에 큰 장점이 있다. 본 연구논 문을 구성하는 Model-Agnostic 모듈중 Black-Box 모형으로 LDA를, 대리분석 모형들로 RF(Random Forest)[6, 20], XGB(Extreme Gradient Boosted)[32], NN(Neural Network) [29]를 적용하였다. 본 연구는 국가의 연구개발 및 투자성과 DB를 내장한 분석플랫폼[41-45]에 관한 선행연구결과에, LDA 토픽모델링과 XAI 분석모듈을 추가하기 위한 목적으 로 수행되었다. <Figure 1>에 요약된 LDA-XAI 루프 프로세 스는 분류기준이 마련되지 않은 국가 연구개발 성과들을 합리적으로 분류하고, 또한 도출된 분류에 합리적인 명칭을 부여하는데 도움이 되는 추론․해석 정보를 제공하는데 그 연구목적이 있다.
비지도학습(Unsupervised) LDA 모델은 토픽의 수를 증 가(K = 2~15) 시키며 라벨(y)을 생성하고, 생성된 라벨은 다양한 지도학습(Supervised) 모델들(Random Forest, XGBoost, Keras Multilayer Perceptron)을 통해 8:2 비율로 학습된 후 예측결과를 평가한다. LDA-XAI 루프 프로세스는 LDA 토픽수를 변화시키는 단계마다 XAI 역 해석 분석 을 수행하여, 생성된 라벨이 문서 전체에 가지는 설명력 과 개별 토픽간 변별력을 Accuracy/Precision/Recall/F1 기 준으로 정량화 한다. 본 LDA-XAI 루프 프로세스를 통해, LDA에 의한 토픽수 결정과정을 지원하고(<Figure 3>~<Figure 4>) 또한 토픽별 상호 변별력(<Table 1>) 정 보를 제공한다.
3.4 동시출현 네트워크
해양수산부의 연구개발 투자로부터 도출된 매출발생 사 례들을 분석하기 위하여, NTIS 연구개발투자DB 중의 자연 어(국문과제명, 한글키워드, 6T 기술분류)와 성과DB 중의 자연어(사업화명, 사업화설명) 정보들을 병합한 문서를 생 성하였다. 그리고 LDA-XAI 분석에 의해 생성된 라벨을 본 문서에 부여하여, 도출된 개별 토픽에 대한 동시출현 네트워크를 구성하였다. 또한 각 토픽별로 생성된 동시출현 네트워크는 LDA 추론된 키워드(<Table 2>)와 유관한 정보 들만을 다시 마이닝 하는 과정을 거친다. 최종적으로 6T - LDA 키워드 - 증거기반 키워드가 연계된 Sankey-Diagram (<Figure 4>~<Figure 5>)을 작성하였다. 본 Sankey-Diagram 들은, 분류 토픽의 명칭을 결정하는 과정에서 설명력을 강 화하기 위한 목적으로 분석되었다.
4. 분석 및 결과
이하 내용은 분류기준이 마련되지 않은 국가의 연구 개발 성과들을 분류하고, 또한 합리적인 분류명칭을 부 여하는데 필요한 분석결과들을 정리한다. 본 결과도출 과정은 “3. 연구방법”에 정리하였듯이, 기존 LDA 선행연 구들 및 LDA 기반의 HITL 프로세스 연구들의 한계점을 개선하기 위하여 수행되었다. LDA Perplexity 기반의 토 픽수 최적화 선행연구들 중에서, 적절한 토픽수를 추정 하기 어려운 사례들이 보고되고 있다. 이러한 한계상황 하에서, 분석자 혹은 자문단은 LDA 모델에 의한 토픽수 를 주관․직관에 의해 결정하게 된다. 본 연구는 LDA의 추론 결과를 XAI 기술을 이용해 역 해석하는 분석모형 을 제안하여, 위 소개한 한계상황들을 개선하는데 기여 한다. LDA-XAI 연계 분석과정을 통해 적절한 토픽수를 결정하거나, 또한 분류된 개별 토픽간의 변별력을 판별 할 수 있는 위한 정량적 수치정보를 도출하였다. 이러한 객관적 수치들은 분석에 의한 의사결정 과정을 합리화 하는데 도움을 준다.
<Figure 3>에 정리하였듯이 본 논문의 모델데이터를 LDA Perplexity 최소화 기법으로 분석한 결과는 그 수치가 단조 감소추세를 보인다. 때문에 적절한 토픽수를 결정하는 데 경험적 주관에 의존하게 된다. 이를 보완하는 대안적인 방법으로, LDA-XAI 루프 프로세스를 적용하였다. 세부적 으로 LDA 토픽모델의 수를 2~15개로 변화시키며, 추론된 분류라벨을 3개의 대리모형들(RF, XGBoost, Keras MLP)에 부여하여 8:2 비율의 지도학습:검증 과정을 수행하였다. 대 리모형들에 의해 도출된 Accuracy 수치를 <Figure 4>에 정 리하였으며, 3개의 대리모형이 모두 우수한 Accuracy 수치 를 보인(K = 2 사례 제외) 6개의 토픽모델링 결과를 채택하 여 이하 분석에서 사용하였다. 또한 6개의 개별 토픽간 변별 력을 정량화 하는 방법으로도 XAI 역 해석 기법을 활용하였 다. <Table 1>에 요약하였듯이 Keras MLP 모형은 Accuracy 기준으로 0.93의 높은 수치를 기록하였으며, 이는 6개 토픽 모델링 결과를 가장 우수하게 해석했다는 것을 의미한다. 또한 Keras MLP 모형에 의한 Recall/Precision/F1 보조 지표 들도 모두 평균값 0.9를 상회하는 결과를 보였으며, 이는 6개의 개별 토픽간 변별력이 높다는 것을 의미한다. LDA 토픽모델링에 의해 분류결과와 더불어, 도출된 6개의 개별 토픽별 키워드들을 <Table 2>에 정리하였다.
LDA 토픽분류를 수행한 후의 대표적인 업무는, 추론된 개별 토픽에 그 명칭을 부여하는 것이다. 그러나 추론된 LDA 키워드들만으로는 토픽명칭을 부여하는데 한계가 많 으며, 때문에 경험에 의존하거나 혹은 전문가자문단의 의견 을 수렴하여 최종 토픽명을 결정하게 된다. 본 연구는 추론된 LDA 토픽명칭의 결정과정을 보조하기 위한 추론-증거 혼합 정보를 마이닝 하여, 선택된 토픽의 성격과 명칭을 파악하는 데 유용한 추가정보를 제공한다. 보다 세부적으로 LDA 추론 된 키워드들을 기준으로, 이들과 연관된 동시출현네트워크 정보와 국가과학기술표준 6T 정보를 추출․재조합 후 최종 결과를 Sankey-Diagram으로 가시화 하였다. 본 논문의 지면 한계상 Sankey-Diagram으로 가시화 할 2개의 토픽을 선택하 였으며, 이를 위해 토픽별 2016-2020년간 매출 발생액을 <Table 3>에 정리하였다. 그리고 <Table 3> 기준으로 매출발 생액이 가장 큰 Topic_3, 그리고 Topic_4의 분석 결과를 Sankey-Diagram으로 <Figure 5>~<Figure 6>에 요약하였다.
Topic_3에 대해 추론-증거 정보를 재조합한 Sankey- Diagram을 <Figure 5>에 가시화 하였다. Topic_3를 대표하 는 국가표준분류 6T 기술은 BT(바이오)로 요약된다. 추론 된 주요 LDA Topic_3 키워드들은 “식품, 수산, BT, 가공, 해외, 소비자, 확대, 선호도, 의식, 간편, 기준, 규격화” 들로 요약된다. 또한 증거기반의 주요 Topic_3 키워드들은 “수 산, 식품, 선호도, 소비자, 해외, 현지화, 해조류” 들로 요약 된다. 증거기반-추론 키워드들의 연계관계를 통해 Topic_3 은 해양유래식품 생산 및 유통 이슈로 파악된다. Topic_4에 대해 추론-증거 정보를 재조합한 Sankey-Diagram을 <Figure 6>에 가시화 하였다. Topic_4를 대표하는 국가표준 분류 6T 기술은 ET(환경) 중심의 BT(바이오)․etc(기타 미 분류) 융합기술로 요약된다. 추론된 주요 LDA Topic_4 키 워드들은 “ET, 선박, 해양, 시스템, BT, 수중, 로봇, 엔진, 방폭형, 에너지, 관리, 감지기, 연료, 알콜, 복합” 들로 요약 된다. 그리고 증거기반의 주요 Topic_4 키워드들은 “해양, 효율, 에너지, 시스템, 친환경, 엔진, 카본, 후처리, 평형수, 항만, 수중, 점검” 들로 요약된다. 증거기반-추론 키워드들 의 연계관계를 통해 Topic_4는 선박․항만의 친환경 운 영․관리체계 이슈로 파악된다.
5. 결 론
정부부처는 정책수립활동에 활용되는 분석결과, 혹은 전 문가 자문단의 의견수렴 결과에 관한 일련의 정보가 보다 설명 가능할 것을 요구하고 있다. 본 연구는 대한민국정부 의 연구개발예산을 배분하는 과학기술혁신본부의 업무를 지원하기 위해 수행된 R&D PIE 사업결과 중, 일부 정보분 석 과정을 고도화하기 위해 수행되었다. 보다 세부적으로 대정부 정보분석을 위해 사용된 LDA 토픽모델링 및 전문가 검증 과정(Human-AI Collaboration) 중, 토픽수를 추정하거 나 혹은 개별 토픽간 변별력을 판단하기 어려운 사례들이 발생하였다. 그리고 본 논문은 위 제시한 한계상황들을 개 선하는데 기여할 수 있는 대안적인 분석 프로세스를 연구하 였다. 본 모델분석을 수행할 데이터로서 해양수산부의 사업 화 성과정보를 사용하였으며, 분석 방법론으로 LDA-XAI 루프 프로세스를 연구하였다. LDA 분석에 XAI 역 해석법 과 증거기반(Evidence-Based) 동시출현네트워크 정보를 보 조하여, 위 제시한 한계상황 하에서도 AI 추론결과에 설명 력을 강화할 수 있었다. 본 연구는 Human-AI 협업 과정을 통해, 정책 의사결정 과정의 투명성을 높이는데 기여할 수 있는 분석 방법론 발전에 기여하였다.