Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.42 No.1 pp.74-86
DOI : https://doi.org/10.11627/jkise.2019.42.1.074

Identifying Interdisciplinary Trends of Humanities, Sociology, Science and Technology Research in Korea Using Topic Modeling and Network Analysis

Jaewoong Choi*, Jaehyuk Jang**, Dae Hwan Kim**, Janghyeok Yoon*
*Department of Industrial Engineering, Konkuk University
**National Research Foundation of Korea
Corresponding Author : janghyoon@konkuk.ac.kr
17/12/2018 22/01/2019 23/01/2019

Abstract


As many existing research fields are matured academically, researchers have encountered numbers of academic, social and other problems that cannot be addressed by internal knowledge and methodologies of existing disciplines. Earlier, pioneers of researchers thus are following a new paradigm that breaks the boundaries between the prior disciplines, fuses them and seeks new approaches. Moreover, developed countries including Korea are actively supporting and fostering the convergence research at the national level. Nevertheless, there is insufficient research to analyze convergence trends in national R&D support projects and what kind of content the projects mainly deal with. This study, therefore, collected and preprocessed the research proposal data of National Research Foundation of Korea, transforming the proposal documents to term-frequency matrices. Based on the matrices, this study derived detailed research topics through Latent Dirichlet Allocation, a kind of topic modeling algorithm. Next, this study identified the research topics each proposal mainly deals with, visualized the convergence relationships, and quantitatively analyze them. Specifically, this study analyzed the centralities of the detailed research topics to derive clues about the convergence of the near future, in addition to visualizing the convergence relationship and analyzing time-varying number of research proposals per each topic. The results of this study can provide specific insights on the research direction to researchers and monitor domestic convergence R&D trends by year.



인문사회 과학기술 분야 연구의 학제적 동향 분석 : 토픽 모델링과 네트워크 분석의 활용

최 재웅*, 장 재혁**, 김 대환**, 윤 장혁*
*건국대학교 산업공학과
**한국연구재단 인재경영팀

초록


    Ministry of Education
    2016-A431-0016

    1. 서 론

    Wilson[33]에 따르면, 고착화된 기존 학제 분야를 뛰어 넘어 지식을 통섭하는 융합 연구가 학술적 발전 및 과학 적 진보를 향한 가장 적절한 방식이라 한다. 실제로 많은 현대의 과학 연구는 기존 학제 분야의 지식이 아닌 이질 적인 분야의 접근법을 적용하여 다수의 문제를 해결하였 다. 예를 들어, 딥러닝은 세포의 신호전달 구조로부터 영 감을 얻은 인공신경망에서 시작하여 다양한 문제를 해결 하였고[29], 미국의 슈터블테크놀로지가 개발한 빔프로는 장애인 치료에 로봇 기술을 적용하여 장애인의 원격 치 료를 가능하게 했다[26]. 이처럼, 단일 학제 분야의 내부 지식만으로는 해결할 수 없는 경우가 빈번히 발생함에 따라, 여러 분야의 지식을 융합하여 문제를 해결하는 학 제간 융합 연구의 중요성이 증가하고 있다[27]. 일찍이, 미국을 비롯한 선진국들은 이와 같은 융합 연구의 중요 성을 인식하고, 국가적 차원에서 연구자들의 융합 연구 활성화, 관련 학과 개설 등을 지원하고 있다. 구체적으로, 미국 국립 과학 재단은 Social, Behavioral and Economic Sciences 분야를 통해, 과학기술과 인문사회의 융합연구 와 같은 다학제 연구 활동을 지원하고 있다[1, 28]. 뿐만 아니라, 유럽 연합국가들은 Seventh Framework Programme 내 ‘Science in Society’ 프로그램을 통해 사회가 직면한 과학기술 관련 문제를 해결하기 위한 연구를 지원 및 활 성화하는 추세이다[6].

    국내 또한, 과학기술 분야와 인문사회 분야 간의 융합 연구가 활발하게 이루어지고 있지만, 실제로 국가 정책 적 관점에서 국가 연구개발 지원사업에서 융합 연구가 전반적으로 어떤 내용을 다루고 있는지에 대해 연구한 사례는 미흡한 실정이다. 또한, 기존 동향 분석 연구들의 대부분은 정보기술이나 생명공학기술과 같은 특정 과학 기술 분야에 한정하여, 과학기술 간의 융합 연구의 동향 을 분석하였다[7, 23]. 한편, 특허 데이터를 활용하여 다 학제 분야간 융합 연구 동향을 분석한 연구도 존재하는 데, 이들이 활용한 특허 데이터는 발명을 기술한 문서이 기 때문에, 사회문제를 해결하거나 공공의 이익을 증진 하는 목적과는 다소 거리가 있어 인문사회 분야에 대한 고려가 다소 부족하다[5, 13]. 마지막으로, Miyazaki and Islam[22]와 Takeda et al.[31]은 나노기술 분야에 속하는 논문데이터를 분석하여 상세 연구주제 간의 융합 연구동 향을 분석하였는데, 이러한 방식은 다양한 학제 분야 간 의 융합 R&D 동향을 파악하는데 한계점을 가진다. 즉, 다학제 분야 간의 융합 연구동향을 분석하려는 시도가 일부 수행되었으나, 그들의 방식은 특정 분야에 한정되 어 전체적인 융합 동향을 파악하기 어렵다. 또한, 그들은 논문, 특허를 활용하였는데, 이러한 데이터들은 연구자 들의 연구나 발명의 결과물을 담고 있어, 미래지향적 측 면에서 연구 동향을 반영하기 어렵다.

    따라서, 본 연구는 한국연구재단에 제안된 연구제안서 를 활용하여 학제간 융합 연구동향을 파악하고자 한다. 여기서, 연구제안서는 특정 연구개발에 관한 사업 계획 을 상세하게 기재하여, 이에 대한 지원을 신청하기 위해 제출하는 문서를 일컬으며, 제안 기관, 연구 기간, 연구 의 목적과 필요성, 연구 내용, 연구성과와 활용방안 등을 연구자들이 기술한다. 따라서, 본 연구에서 활용하는 연 구제안서는 연구자들이 수행하고자 계획한 연구 내용들 을 여실히 포함하고 있으며, 그들의 독창적이고 진취적 인 연구주제를 담고 있다. 본 연구는 한국연구재단의 학 제간 융합연구지원 사업에 제안된 대량의 제안서 데이터 를 수집하여, 국내의 학제간 융합 연구 동향을 분석하고 자 한다. 우선, 본 연구는 수집된 제안서 데이터를 전처 리하여 키워드 벡터로 구조화한 뒤, 토픽 모델링을 적용 하여 잠재적인 토픽들을 도출한다. 다음으로, 연구제안 서들이 주로 다루고 있는 상세 연구주제들을 식별하고, 상세 연구주제 간의 동시 출현 관계를 파악하여 융합 관 계를 분석한다. 본 연구는 네트워크 분석 및 계량적 지표 분석을 통해, 시간의 흐름에 따라 변화하는 상세 연구주 제들의 융합 관계를 시각화하고 각 상세 연구주제들의 융합성과 잠재성을 정량적으로 분석한다.

    본 연구는 특허나 논문과 같은 연구자들의 연구 결과 를 담고 있는 데이터가 아닌, 연구 계획이나 방향을 여실 히 포함하고 있는 연구제안서 데이터를 기반으로 연구동 향을 분석하였기 때문에, 연구자들의 목표나 최신의 트 렌드를 보다 정확하게 모니터링 할 수 있다. 뿐만 아니 라, 본 연구는 학제간 융합연구지원 사업에 지원된 연구 제안서를 선별적으로 사용하였기 때문에, 인문사회 분야 와 과학기술 분야 간의 융합을 파악할 수 있고, 이와 같 은 분석 결과는 타학문에 관심이 있는 연구자들에 새로 운 방향을 제시할 수 있다. 즉, 본 연구의 분석 결과는 연구자들로 하여금 해결하고자 하는 문제를 다룰 수 있 는 새로운 관점의 접근 방식에 대한 인사이트를 제공할 수 있다. 또한, 본 연구의 네트워크 지표 분석 결과의 경 우, 가까운 미래에 잠재적으로 융합될 수 있는 상세 연구 주제에 대한 힌트를 제공할 수 있고, 이는 부상 기술 예 측, 기술 기회 등의 문제에도 활용될 수 있다. 나아가, 본 연구의 동향 분석 결과는 국가의 연구지원을 통해 이루 어지는 연구제안서를 활용하였기 때문에, 국가 전체 융 합 R&D 동향과 연구자들의 수요를 파악할 수 있고, 이 는 정책 결정자의 의사결정을 지원할 수 있다. 구체적으 로, 국내의 과학기술 분야와 인문사회 분야 간의 융합 연 구가 어떠한 형태로 이루어지는지, 어떤 내용을 다루는 지 등을 파악할 수 있다. 다음으로, 본 연구의 결과를 통해 융합네트워크 내에서 중요하지만, 재정적으로 지원을 상 대적으로 받지 못한 연구분야를 탐지하고, 추가적으로 지원할 수 있다.

    본 논문의 구성으로는 제 2장에서 본 연구에서 활용한 토픽 모델링과 네트워크 분석에 대해 설명하고, 제 3장 에서 학제 간 융합 연구의 동향을 분석하기 위한 절차와 단계별 산출 결과를 구체적으로 설명한다. 제 4장에서는 분석 구간별 융합 연구의 동향을 네트워크 구조를 통해 가시적으로 나타내며, 분석결과에 대한 해석을 제시한다. 마지막으로, 제 5장에서는 본 연구의 결론, 한계점 및 추 후연구에 대해 기술한다.

    2. 배경연구

    2.1 토픽 모델링(Topic Modeling)

    토픽 모델링은 텍스트 문서의 집합을 구성하는 단어를 분석함으로써, 잠재적인 주제를 도출하는 확률 기반의 모형을 일컫는다[2]. 토픽 모델링에서 모든 문서는 단어들 의 벡터로 표현되며, 벡터들의 조합은 문서가 가지는 잠 재적인 토픽을 표현한다. 이러한 방식은 구조화되지 않 은 문서 집합에서 잠재적인 토픽을 이끌어낼 수 있고, 결 과적으로 대량의 문서를 분류할 수 있어 다양한 텍스트 분석 연구에 활용되어왔다[10, 17]. 본 연구는 대량의 연 구제안서 데이터로부터 세부적인 연구 주제들을 식별하기 위해, 대표적인 토픽 모델링 기법인 LDA(Latent Dirichlet Allocation) 알고리즘을 활용하였다.

    토픽 모델링을 위한 기법으로는 LSA(Latent Semantic Analysis), pLSA(Probabilistic Latent Semantic Analysis), LDA 등이 있다. 특히, LDA는 문서 집합 수가 증가함에 따라 발생하는 오버피팅 문제에 강건하고, 학습 범위 밖 의 문서에 대해 토픽 할당이 어렵다는 기존 문제점을 수 정 보완한 기법이다. 우수한 문서 분류 성능뿐만 아니라, LDA는 문서 수준에서 확률 모델을 제공하여, 결과 해석 이 용이하다는 장점을 가진다[21]. 구체적으로 LDA는 사 람이 문서를 작성한다는 가정하에서, 문서의 잠정적 주 제를 찾아내는 디리클레 분포 기반의 생성 모형이다[3].

    LDA 과정을 통해, 최종적으로 전체 문서집합에 대한 각 문서의 토픽 분포를 나타내는 문서-토픽 매트릭스와 토픽별 구성 단어의 분포를 나타내는 토픽-키워드 매트 릭스가 생성된다. 이러한 LDA의 결과를 통해, 대량의 문 서로부터 잠정적인 토픽들을 파악할 수 있고, 이는 문서 분류뿐만 아니라, 동향 분석, 기술 경쟁 정보 분석 등의 목적으로 활용될 수 있다[16]. 대표적인 사례로, Jeong et al. [11]은 특정 스마트폰 제품에 대한 고객들의 리뷰 데이 터에 LDA 알고리즘을 적용하여, 고객들의 요구사항, 불 만 등을 내포하고 있는 토픽들을 산출하여 분석에 활용 하였다. 또한, Oh et al.[24]은 증강현실 기술에 대한 동 향을 분석하기 위해, 대량의 미국 특허를 대상으로 LDA 를 적용하여 세부기술 요소를 도출하여 추세 분석에 활 용하였다. 뿐만 아니라, Lee et al.[19]은 특허 문서로부터 ‘해결하고자 하는 문제’와 ‘해결 방법’ 텍스트 데이터에 각각 LDA를 적용하여, 공통의 문제와 해결방법을 토픽 의 형태로 파악하여 기술 경쟁 동향 분석에 활용하였다.

    2.2 네트워크 분석(Network Analysis)

    일반적으로 네트워크 혹은 사회연결망은 행위자(노드) 와 노드 간의 관계를 나타내는 링크로 구성된다[8]. 이러 한 네트워크의 구조적 특성에 기반하여, 네트워크 분석 은 노드 간의 연결관계 혹은 전체 및 부분적인 패턴을 설명한다[30]. 네트워크 분석은 가시적으로 파악하기 어 려운 노드 간 상호 연결 관계를 시각적으로 표현함으로 써, 데이터의 복잡한 구조를 한눈에 파악할 수 있도록 할 뿐만 아니라, 다양한 네트워크 지표를 통해 계량적인 분 석 또한 가능하게 한다[34].

    네트워크의 계량적인 분석은 크게 (1) 네트워크의 링 크가 생성된 패턴을 기반으로 네트워크의 특징을 다루는 기본 속성 분석과 (2) 노드 관점에서 네트워크 중심에 위 치하는 정도를 분석하는 중심성 분석으로 나뉜다. 기본 속성 분석의 계량적 지표는 네트워크 크기, 연결 정도와 밀도 등이 있으며, 중심성 지표로는 연결정도 중심성, 근 접 중심성 그리고 매개 중심성이 있다[14]. 첫 째로, 연결 정도 중심성은 한 노드에 전체 네트워크 내 노드들이 연 결된 링크의 수를 나타내는데, 이는 해당 노드에 대해 직 접적인 링크가 잦을수록 네트워크 내에서 해당 노드가 강한 영향력을 행사한다는 것을 전제한다. 반면에, 근접 중심성은 연결정도 중심성과 다르게, 전체 네트워크에서 영향을 미치는 정도를 측정하는 지표로, 다른 노드 간 최 단거리의 합의 역수를 통해 측정한다. 마지막으로, 매개 중심성은 한 노드가 다른 두 노드 간의 최단경로 사이에 있는지를 활용하여, 네트워크 내 매개체의 역할을 얼마 나 할 수 있는지를 보여준다.

    네트워크 분석은 단순히 분석 결과의 시각화뿐만 아 니라, 네트워크 내 중추적인 역할을 수행하는 노드를 파 악하기 위한 목적으로 다수의 연구에서 활용되어 왔다. 대표적인 사례로, Kim et al.[15]은 증강현실 기술 분야와 관련된 특허들의 분류코드를 활용하여, 세부기술 간의 영향관계를 시각화하고, 영향력이 높은 세부기술을 파악 하기 위한 목적으로 네트워크 분석을 활용하였다. 또한, Lee et al.[18]은 바이오 연료 기술 분야에 속하는 대량의 특허를 기반으로, LDA를 적용해 상세 기술 분야를 도출 하고, 상세기술 분야 간의 관계를 네트워크 분석을 통해 시각화하여 기술 동향을 파악하고자 시도하였다.

    3. 연구절차

    본 연구가 진행되는 분석 과정은 <Figure 1>의 절차를 따른다. 1) 우선, 연구제안서 데이터를 수집하고 전처리 하여 문서를 키워드 조합으로 구성된 벡터로 구조화한 다. 2) 다음으로, 토픽 모델링 기법을 적용하여 잠재적인 토픽들을 도출하고 연구제안서에 기술된 상세 연구주제 로 정의한다. 3) 토픽 모델링의 결과인, 문서가 토픽에 속할 확률 값을 기반으로 각 제안서가 상세 연구주제를 포함하는 관계를 식별한다. 마지막으로 4) 제안서-상세 연구주제 간의 포함 관계를 기반으로 네트워크를 형성하 고, 상세 연구주제 간의 융합 관계를 파악하고 동향을 분 석한다.

    3.1 연구제안서 수집 및 전처리

    본 연구는 학제 간 융합 연구 동향을 파악하기 위해 한국연구재단의 학제간 융합연구지원 사업에 속하는 연 구 제안서 데이터를 활용한다. 즉, 본 연구의 목적은 융 합연구들의 세부 주제를 식별하고, 구체적인 융합관계를 분석하는 것이기 때문에, 둘 이상의 연구 분야가 융합된 연구들의 제안서를 선별하여 활용하였다. 구체적으로, 본 연구는 2009년부터 2016년 6월까지 한국연구재단에 제 안된 1,056건의 제안서 데이터를 사용했다.

    다음으로, 텍스트 분석 및 토픽 모델링을 위해 수집 된 연구제안서 데이터로부터 키워드를 추출하였다. 구 체적으로, 연구제안서에서 과제명, 연구목적과 필요성, 연구내용, 활용방안 등의 다양한 서지정보로부터 키워 드를 추출할 수 있다. 본 연구에서는 개별 연구제안서 가 다루는 연구의 주된 내용을 파악하기 위해, 과제명 과 연구제안서 키워드로부터 자연어 처리 과정을 통해 국문 키워드를 추출하였다. 자연어 처리는 인간이 언어 를 이해하고 사용한 방법에 대한 지식을 수집하여, 컴 퓨터 시스템으로 하여금 자연어를 이해하고 작업을 수 행할 수 있게끔 지원한다[4]. 구체적으로, 자연어 처리 는 문자열, 형태소, 단어, 구, 절, 문장, 문단, 문서 등의 다양한 수준에서 수행될 수 있으며[12], 형태소 분석, 구문 분석, 의미 분석, 담론 분석 등을 진행할 수 있다 [9]. 본 연구는 형태소 분석을 활용하여 연구제안서로 부터 키워드를 추출했다. 국문의 형태소 분석을 지원하 는 자연어 처리 도구로는 Hannanum, Kkma, Komoran, Mecab, Twitter 등이 있다. 본 연구는 대표적인 형태소 분석 도구인 Kkma를 활용하여, 총 9,275개의 키워드를 추출하였다[25].

    형태소 분석을 통해 추출한 초기 키워드 집합에는 연 구제안서가 다루는 연구 주제와 직접적으로 관련이 없는 불용어를 포함하기 때문에, 일련의 제거 과정이 필요했 다. 구체적으로, 본 연구에서는 ‘개발’, ‘기술’, ‘사회’, ‘시스템’, ‘과학’, ‘연구’, ‘분석’과 같이 연구제안서에서 일반적으로 빈번하게 사용되는 키워드들과 ‘융합’, ‘복 합’, ‘학제간’과 같이 학제간 융합연구 사업을 지칭하는 키워드들은 제거되었다. 또한, 국문 특성 상, ‘차’, ‘신’, ‘성’과 같이 한글자로 이루어진 단어는 중의적인 의미를 가지는 경우가 많기 때문에, 연구주제에 대한 명확한 해 석을 위해 특수문자와 더불어 제거되었다. 마지막으로 전체 문서 집합에서 출현빈도가 1 이하인 키워드들을 제 거함으로써 2,938개의 최종 유효 키워드 집합을 구성하 였다. 이러한 전처리 과정을 통해, 각 연구제안서를 상세 한 연구주제를 의미하는 키워드 벡터로 변환하여 구조화 한 뒤, 연구제안서-키워드 출현빈도 매트릭스를 생성하 여 토픽 모델링에 활용했다(<Figure 2> 참조).

    3.2 상세 연구주제 정의

    본 단계에서는 연구제안서 데이터로부터 세부 연구주 제를 파악하기 위해, 이전 단계에서 생성한 연구제안서- 키워드 출현빈도 매트릭스를 토픽 모델링 알고리즘의 투 입 자료로 사용하였다. 본 연구는 LDA 기반의 토픽 모델 링을 통해, 연구제안서로부터 잠정적인 토픽들을 도출하 고, 이를 상세 연구주제로 정의하였다. LDA 기반의 토픽 모델링은 전체 연구제안서 내 상세 연구주제를 나타내는 토픽의 개수를 결정해주어야 한다. 본 연구는 최적의 토 픽 수를 결정하기 위해, 토픽 모델링의 결과물 중 하나인 토픽-키워드 매트릭스를 기반으로 토픽 간 유사도를 활 용하였다. 구체적으로, 최적 토픽 수가 결정되면 모든 상 세 연구주제들이 명확하게 구분될 것으로 기대되기 때문 에, 본 연구는 평균 토픽 간 유사도가 최소일 때의 토픽 수를 최적 토픽 수라고 정의했다. 이러한 방식은 Wang et al.[32]에 의해 제안되었는데, 토픽 간의 유사도의 평 균값을 토픽 수를 조정하면서 산출한 뒤, 그 값이 최하점 에 도달하였다가 상승하는 반등점이나 값이 안정되기 시 작하는 지점(토픽 수)을 최적 토픽 수로 정의한다. 본 연 구에서는 토픽 간의 키워드 분포 유사도를 계산하기 위 해, 코사인 유사도를 활용하였다. 본 연구는 최적 토픽 수를 결정하기 위해, 토픽 수를 15부터 105까지 설정한 후 토픽 모델링을 실시하였다. 다음으로, 토픽 간 평균 코사인 유사도를 계산한 결과, 평균 코사인 유사도가 토 픽 수가 30개일 때까지 감소하는 추세를 보이다가, 토픽 수가 55개일 때부터 증가하는 경향을 보였다. 또한, 토픽 간 평균 코사인 유사도는 토픽 수가 40개와 50개일 때, 각각 0.0353와 0.0365로 가장 작은 값을 보였다. 본 연구 는 토픽 수를 40개와 50개로 설정하여 토픽 모델링을 실 행하여, 토픽-키워드 분포를 기반으로 분류된 상세 연구 주제의 내용적 적합성을 평가하였다. 결과적으로, 토픽 수를 40으로 설정한 토픽 모델링의 결과가 보다 적합하 다고 판단하여, 토픽 수를 40개로 결정하였다.

    다음으로, 본 연구는 최적 토픽 수 40개에 해당하는 토픽 모델링을 통해, 연구제안서 별 토픽들의 분포와 토 픽별 키워드의 분포를 얻었다. 우선, 토픽별 키워드 분포 를 통해 도출된 토픽들이 높은 확률로 포함하는 키워드 를 파악하였다. 즉, 연구제안서 별 토픽 분포의 경우, 연 구제안서가 높은 확률로 포함하고 있는 토픽을 파악함으 로써 연구제안서가 주로 다루는 연구주제를 식별할 수 있다. 이와 같이, 본 연구는 각 토픽을 구성하는 키워드 가운데 높은 확률 값을 가지는 상위 키워드와 해당 토픽 을 포함하는 연구제안서를 참고하여, 각 토픽이 지칭하 는 상세 연구주제를 정의하였다(<Table 1> 참조). 이러한 토픽 레이블링 과정을 통해 정의된 토픽들은 다음과정인 네트워크 분석과 융합 연구 동향 분석에 활용되었고, 레 이블링된 토픽들에 대한 해석은 제 4장에서 설명한다.

    3.3 연구제안서 별 상세 연구주제 식별

    본 단계는 LDA 기반의 토픽 모델링의 산출물을 통해, 개별 연구제안서가 주로 다루는 상세 연구주제를 식별한 다. 구체적으로, 연구제안서-토픽 분포에서 개별 연구제 안서가 각 토픽을 포함하는 확률 값은 해당 연구제안서가 각 토픽과 관련된 정도를 의미한다. 예를 들어, 연구제안서 (2014045040)는 Topic 1을 0.013929, Topic 2를 0.015551, Topic 3을 0.014508, Topic 4를 0.018331, Topic 5를 0.323902, Topic-6을 0.014972의 확률 값으로 포함하고 있다. 해당 연구제안서는 Topic 5를 가장 높은 확률로 포함하고 있 어, 주로 Topic 5를 다루고 있음을 확인할 수 있다.

    다음으로, 연구제안서-토픽 분포에서 개별 연구제안서 는 모든 토픽에 대해 0 이상의 확률 값을 가지고 있기 때문에, 확률 값에 대하여 적당한 임계치 값을 설정하여 개별 연구제안서가 가지는 유효한 토픽을 선정하는 과정 이 필요하다. 본 연구는 벡터 공간 모델의 유사도를 활용 하여 네트워크상에서 연결 여부를 결정하는 방법을 적용 하였다[20]. 구체적으로, 해당 방식은 네트워크를 정규화 하고, 기준이 되는 매트릭스를 생성한 뒤, 다양한 임계치 값을 적용한 매트릭스와 유사도를 산출한다. 다음으로, 여러 임계치 값에서 계산한 유사도의 변화가 줄어드는 엘보우 점(elbow point)을 적절한 임계치 값으로 결정한다. 본 연구에서는 연구제안서 별로 각각의 토픽 분포를 가 지는 2-mode 매트릭스에 적용하기 위해, 연구제안서-토 픽 매트릭스의 각 행을 정규화하는 방식으로 수정하여 최적 임계치 값을 결정했다. 결과적으로, 기존 매트릭스 의 95%를 설명하는 0.22를 최적 임계치 값으로 적용하 여 개별 연구제안서가 다루는 토픽을 식별했다. 따라서, 본 단계를 통해 개별 연구제안서가 어떤 세부 연구주제 를 다루고 있는지를 파악하였고, 연구제안서와 토픽 간 의 포함 관계를 도출하였다(<Figure 3> 참조).

    3.4 상세 연구주제간 융합관계 분석 및 네트워크 구축

    본 단계는 네트워크 분석을 통해, 총 1,056건의 제안 서 데이터를 연도별로 나누어, 상세 연구주제 간의 융합 관계를 시각화하고, 네트워크 지표 분석을 통해 네트워 크 내 핵심적인 상세 연구주제를 파악한다. 실제로, 학제 간 융합연구 사업에 지원한 연구제안서들은 여러 개의 상세 연구주제를 동시에 포함할 수 있고, 이때, 동시에 다뤄진 상세 연구주제들은 융합되었다고 판단할 수 있다. 따라서, 본 연구는 상세 연구주제간 융합 유무를 파악하기 위하여, 개별 연구제안서 내 상세 연구주제들의 동시 출 현 횟수를 계산하고, 이를 기반으로 상세 연구주제 동시 출현 매트릭스를 형성했다. 여기서, 두 개의 상세 연구주 제 간의 융합관계 강도의 값이 크다는 것은 해당 상세 연구주제들이 많은 연구제안서에서 융합되어 활용되었 음을 의미한다. 이렇게 형성된 상세 연구주제 간의 동시 출현 매트릭스를 네트워크 구조로 시각화함으로써, 상세 연구주제 간의 융합 관계를 쉽게 파악할 수 있다.

    다음으로, 본 연구는 상세 연구주제 간의 융합 네트워 크를 기반으로, 네트워크 내 핵심적인 노드(상세 연구주 제)와 중개자 역할을 하는 노드를 식별한다. 구체적으로, 본 연구는 노드의 중심성을 분석하기 위해, 근접 중심성 과 매개 중심성을 계산하였다. 우선, 근접 중심성은 전체 네트워크에서 다른 노드까지의 최단거리의 합의 역수를 통해 측정하는데, 융합 네트워크에서 이는 상세 연구주제 의 융합성을 의미한다. 즉, 상세 연구주제의 근접 중심성 이 높으면, 해당 상세 연구주제가 융합 네트워크 내에서 중심적인 위치를 차지하고 있어, 다른 노드들과의 융합관 계가 짙음을 의미한다. 반면에, 매개 중심성은 한 노드가 노드들 간의 최단경로에 포함된 비율을 합하여 계산하는 데, 융합 네트워크에서 상세 연구주제의 잠재성을 의미한 다. 다시 말해, 매개 중심성이 높은 상세 연구주제는 융합 네트워크에서 다른 노드들 간의 융합관계에 잠재적으로 많은 영향을 끼치고 있기 때문에, 매개 중심성은 다른 상 세 연구주제들과 융합될 잠재성을 내포하고 있다.

    4. 분석결과 및 해석

    4.1 연구제안서 통계 자료

    본 연구는 2005년부터 2016년 6월까지 한국연구재단 의 연구지원사업에 제안된 43만여 건의 연구제안서를 수 집하여 데이터베이스를 구축하였다. 한국연구재단은 제 안된 연구제안서를 대사업명, 중사업명, 소사업명, 세부 사업명으로 이루어진 계층적 구조에 따라 분류한다. 본 연구는 인문사회와 과학기술 분야 간의 융합연구에 대한 동향을 분석하기 위해, 세부사업이 학제간 융합연구지원 사업으로 분류된 연구제안서를 선별하여 활용했다.

    학제간 융합연구지원 사업은 2009년부터 추진되었으며, 2016년 6월까지 1,056건의 연구제안서가 한국연구재단에 제출되었다. 연구제안서의 수는 사업 개시 이후로 2012년까 지 감소 추세를 보였으나, 2013년을 기점으로 81건, 141 건(2014년), 171건(2015년)으로 점증하는 추세를 보였다. 또한, 2016년의 경우, 수집 기간이 6월까지로 상대적으로 짧은 기간임에도 불구하고, 162건의 연구제안서가 제안 된 사실을 고려할 때, 학제간 융합연구에 대한 연구자들 의 관심이 지속적으로 증가하고 있음을 확인할 수 있다.

    4.2 도출된 상세 연구주제

    학제간 융합연구지원 사업에 속하는 연구제안서 1,056 건에 토픽 모델링을 적용한 결과, 40개의 토픽을 도출하 였고, 각 토픽의 주요 키워드와 높은 확률로 포함되는 연 구제안서의 내용을 기반으로 상세 연구주제를 정의하였 다(<Table 2> 참조). 예를 들어, Topic 1은 ‘의학’, ‘치료’, ‘스트레스’, ‘치유’, ‘심리’, ‘정신’, ‘명상’, ‘사상’, ‘심신’, ‘마음 챙김’과 같은 키워드들을 높은 확률로 가지는데, 실 제로 해당 토픽에 속하는 연구제안서들은 심리학적 기법 을 사용하여 심리적 고통과 부적응 관련 문제를 다루는 치료법을 주로 다루었다. 한편, Topic 25는 ‘건강’, ‘의료’, ‘증진’, ‘보건’, ‘정신’, ‘케어’, ‘정신건강’을 주요 키워드 로 포함하였고, 해당 토픽에 속한 연구제안서들은 질병에 대한 저항력 증가와 활동량 증대를 포함하여, 더 나은 건강 상태를 목표로 하는 내용을 다루었다. 반면에, Topic 4는 ‘스마트’, ‘공학’, ‘스마트폰’, ‘마이닝’, ‘소프트웨어’, ‘온 라인’, ‘정보기술’, ‘자동’을 주요 키워드로 포함하였고, 해당 토픽에 속하는 연구제안서들은 정보처리 기능이 탑 재된 스마트 폰과 같은 지능형 장치 및 시스템에 대한 연 구를 주로 다루고 있었다. 따라서, 본 연구에서 수행한 토 픽 모델링의 결과가 연구제안서들이 다루고 있는 상세 연 구주제를 적절하게 대표하고 있음을 확인할 수 있다.

    다음으로, 정의된 상세 연구주제 별 연구제안서 분포 에 적절한 임계치 값을 적용함으로써, 연구제안서가 주 로 다루고 있는 상세 연구주제를 식별하였다. 분석기간 인 2009년부터 2016년 6월까지 학제 간 융합 연구에서 어떤 연구주제를 많이 다루고 있는지 파악하기 위하여, 상세 연구주제를 포함하고 있는 연구제안서의 수를 계산 하였다(<Table 3> 참조). 40개의 상세 연구주제 가운데, ‘디자인’, ‘건강증진’, ‘노인복지’, ‘가치평가’, ‘맞춤형 컨 텐츠’, ‘빅데이터’ 상세 연구주제에 두드러지게 많은 연 구제안서가 포함되는 것을 확인할 수 있다. 반면에, ‘전 통문화’, ‘다양성’, ‘학습’, ‘생물’, ‘물리학’, ‘역사’ 상세 연구주제에는 70개 남짓한 다소 적은 수의 연구제안서가 포함되었다. 이는 ‘디자인’, ‘가치평가’, ‘맞춤형 컨텐츠’와 같은 활용 중심의 상세 연구주제들이 학제간 융합을 통 해 실제로 적용가능한 제품, 시스템 등을 설계하거나, 그 들을 가치 평가하는 내용을 주로 다루었기 때문에, 학제 간 융합 연구지원사업의 많은 연구제안서가 해당분야들 에 속하였다고 판단할 수 있다. 대조적으로, ‘생물’, ‘물 리학’, ‘역사’와 같은 상세 연구주제들은 이론 중심의 내 용이 짙었기 때문에, 학제간 융합 연구지원사업에서 다 소 적은 연구제안서들이 속했다고 판단된다.

    4.3 시계열적 추이 분석

    본 연구는 학제간 융합 연구지원사업에 제안된 연구 제안서들을 상세 연구주제 별로 시계열적 추이를 분석함 으로써 시간의 흐름에 따른 연구 동향을 살펴보았다. 구 체적으로, 본 연구는 2009년부터 2016년까지 연도별로 연구제안서가 가장 많이 제출된 상세 연구주제들을 탐색 하고 비교하였다. 예를 들어, 2009년에서 2011년까지 ‘정 책과 전략’에 속하는 연구제안서가 다수 제안되었는데, 이들은 주로 지구온난화, 한랭화와 같은 미래의 기후변 화에 대한 대응방안, 정책과 전략을 구체적으로 제시하 였다. 이는 당시에 기후변화로 인한 문제에 대한 인식이 증가하고, 해결방안에 대한 연구자들의 시도가 증가하였 음을 암시한다. 한편, ‘빅데이터’의 경우, 2014년 이후로 꾸준히 상위권에 등장하였는데, 이들은 실제로 빅데이터 분석을 통한 맞춤형 정보 제공, 예측 평가, 서비스 모델 개발 등과 같은 다수의 연구제안서를 포함했다. 또한, 해 당 시기는 정부주관의 공공데이터 오픈 정책의 개시 시 기(2013년)와 일치하여, 당시에 빅데이터 분석을 통한 문 제 해결 시도가 증가하였음을 확인할 수 있다.

    또한, 본 연구는 상세 연구주제 별로 시간의 흐름에 따른 연구제안서 비율의 추이를 비교 분석하였다(<Figure 4> 참 조). 구체적으로, 개별 상세 연구주제에 속하는 연구제안서 전체를 기준으로, 연도별 연구제안서 수를 정규화하여 그 래프로 표현하였다. 이는 절대적인 연구제안서 수를 통해 서는 파악하기 어려운, 상세 연구주제 내에서의 동향을 상 대적인 비율을 통해 파악하기 위함이다. <Figure 4>는 시 계열적 변화가 두드러지는 상세 연구주제 15개를 포함하 고 있는데, 구체적으로 ‘정책과 전략’, ‘생태’, ‘네트워크’, ‘전통문화’, ‘심리치료’, ‘정신질환’, ‘언어처리’의 경우, 감 소하는 추세를 보이고 있다. 반면에, ‘노인복지’, ‘건강증 진’, ‘디자인’, ‘상호작용’, ‘제품혁신’, ‘창의성’, ‘안전’, ‘빅 데이터’의 경우, 증가 후 유지되는 추세를 보여주고 있다. 전반적으로, 2009년에서 2012년에 이르는 초기 분석기간 에는 ‘정책과 전략’, ‘심리치료’, ‘정신질환’과 같이 사회문 제, 기후문제 등을 해결하고자 하는 시도가 많았고, 2013년 에서 2016년까지 후기 분석기간에는 ‘건강증진’, ‘제품혁 신’, ‘노인복지’와 같이 삶의 질을 개선하고자 하는 시도가 증가하였음을 알 수 있다. 또한, 2014년을 기준으로, 이전 에는 네트워크 구조를 이용하여 서비스 개발, 경쟁력 분석, 기업 운영방안 개발 등을 시도한 연구가 많았으나, 2014년 이후에는 빅데이터를 기반으로 맞춤형 정보 제공, 서비스 모델 개발, 여론 분석 등에 대한 연구가 많이 제안되었다.

    4.4 융합 네트워크 분석 결과

    본 연구는 학제간 융합 연구지원사업에서 상세 연구주 제 간 융합관계를 계량적으로 분석하기 위해, 연도별 네 트워크 분석을 수행하였다. 구체적으로, 융합 네트워크는 연구제안서 내 상세 연구주제들의 동시 출현 관계를 기 반으로 생성되었다. 여기서, 하나의 연구제안서에서 동시 에 다뤄지는 상세 연구주제들은 서로 연관되어 있음을 의미하고, 본 연구는 이러한 동시 출현 관계를 상세 연구 주제 간의 융합 강도로 간주한다. 즉, 많은 연구제안서에 서 동시에 다뤄진 상세 연구주제들은 융합 강도가 강하 고, 실제로 서로 융합되어 활용된 적이 많음을 의미한다. 따라서, 융합 네트워크의 노드는 상세 연구주제를 의미 하고, 링크는 상세 연구주제 간의 융합관계를 나타낸다. 또한, 융합 네트워크에서 노드의 링크의 굵기는 분석 기 간에서 상세 연구주제들의 동시 출현 횟수, 즉 융합관계 의 강도를 나타내고, 노드의 크기는 동일 기간에서 상세 연구주제에 속하는 연구제안서의 수로 설정하였다.

    2009년에서 2012년까지의 초기 분석기간에는 ‘정책과 전략’와 ‘지속가능’, ‘네트워크’와 ‘정책과 전략’, ‘노인복 지’와 ‘정신질환’과 같은 융합 관계를 통해, 정책적인 해결 시도가 두드러지는 반면에, 2013년에서 2016년까지의 후반 분석기간에는 ‘네트워크’-‘빅데이터’, ‘공간분석’-‘빅데이 터’,’디자인’-‘빅데이터’, ‘빅데이터’-‘인지과학’과 같은 융 합 관계를 통해 데이터 분석 기반의 문제 해결 및 개선을 다수의 연구자들이 시도하였음을 알 수 있다. 특히, 2011년 의 융합 네트워크의 경우, ‘네트워크’와 ‘상호작용’, ‘스마 트’와 ‘인문학’, ‘디자인’과 ‘공간분석’과 같은 융합 연구가 다수 수행되었다(<Figure 5> 참조). 특히, ‘네트워크’와 ‘상 호작용’의 융합 관계의 경우, 소셜네트워크 서비스의 사용 량과 관심도가 증가함에 따라, 소셜네트워크 서비스가 사람 들의 관계에 주는 영향에 대한 연구를 주로 진행하였는데, 대표적인 사례로, “헬스 2.0 소셜 플랫폼 모델 개발”, “SNS 의 공적․사적 영역의 구조변환에 대한 영향”, “모바일 환 경에서의 사이버 인상이 신뢰에 미치는 영향에 관한 실증적 연구” 등이 있다. 또한, ‘스마트’와 ‘인문학’의 융합 관계는 기존의 인문학을 스마트 제품이나 시스템을 통해 해석하고, 새로운 관점을 제시하고자 하는 연구에서 두드러졌다. 실제 로, 2011년도에 “신화를 활용한 창조적 리더십 교육 프로그 램 연구-<미토스 코드 Mythos Code> 리더십 연구”, “연화 (年畵)의 문화코드 읽기와 감성공학적 해석을 통한 콘텐츠 활용방안”, “인문학 기반의 인간․자동차 인터페이스 개발 연구”와 같은 연구제안서들이 다수 제안되었다. 한편, ‘디자 인’과 ‘공간분석’의 융합 관계의 경우, 사용자들을 고려함으 로써 현대의 생활공간이나 전시공간을 개선하고자 시도한 연구들을 지칭한다. 이들은 “전시공간 설계를 위한 관람행 태 분석 표준모델 개발”, “전통공간 속 인문적 상상력을 통한 현대생활공간의 경관공학적 적용; 환경조경, 기후디자 인, 감성반응을 중심으로”, “고령 인구층의 우울증완화를 위한 감성기반의 건강공간시스템 측정지표개발”과 같은 연 구제안서들을 포함한다. 마지막으로, 2015년의 융합 네트 워크에서는 ‘공간분석’과 ‘빅데이터’, ‘맞춤형 컨텐츠’와 ‘문화예술’, ‘맞춤형 컨텐츠’와 ‘인터렉티브 컨텐츠’의 융합 관계가 강하게 나타났다(<Figure 5> 참조).

    4.5 중심성 분석

    본 연구는 상세 연구주제간 융합 네트워크에서, 근접 중심성과 매개 중심성을 계산하여, 각각 상세 연구주제 의 융합성과 잠재성에 대한 계량적인 분석을 시도하였 다. 본 연구에서 정의하는 상세 연구주제의 융합성은 특 정 상세 연구주제가 융합 네트워크 내에서 얼마나 중심 적인 위치를 차지하고 있는지 즉, 근접중심성을 의미한 다. 융합성이 높은 상세 연구주제는 융합 네트워크에서 영향력이 강하다고 판단할 수 있다. 상세 연구주제의 잠 재성의 경우, 특정 상세 연구주제가 융합 네트워크에서 매개체의 역할을 수행하는 정도 즉, 매개중심성을 의미 한다. 잠재성이 높은 상세 연구주제는 다른 상세 연구주 제들과 융합될 가능성이 높다고 판단할 수 있다.

    우선, 2011년의 융합 네트워크에서 근접 중심성과 매 개 중심성을 통해, 상세 연구주제들의 융합성과 잠재성 을 측정하여 맵핑한 결과는 <Figure 6>과 같다. 구체적으로, 2011년의 융합 네트워크에서, ‘네트워크’(융합성 : 0.6190), ‘스마트’(융합성 : 0.1581)가 융합 네트워크 내에서 중심 적인 역할을 수행하였는데, 이들 대부분은 2010년의 융 합 네트워크에서 각각 0.1370과 0.0846의 높은 잠재성을 보였다. 반면에, ‘맞춤형 컨텐츠’, ‘디자인’의 경우, 각각 0.6190과 0.6094의 융합성을 가지고, 많은 융합 관계에 관여하였다. 그들은 2010년에는 잠재성이 다소 낮았지 만, 2011년의 잠재성이 각각 0.1180과 0.0869로 높았기 때문에, 다음 분석 구간에서 활발하게 융합에 관여할 잠 재성이 높다고 판단할 수 있다. ‘건강증진’ 또한, 융합성 은 0.5342로 다소 낮았으나, 잠재성이 0.0875로 매우 높 아 다음 분석 기간에서 중심적인 역할을 수행할 가능성 이 높다고 판단할 수 있다.

    다음으로, 2015년의 융합 네트워크의 경우, 융합성과 잠 재성 관점에서 ‘가치평가’(융합성 : 0.6275, 잠재성 : 0.1144), ‘맞춤형 컨텐츠’(융합성 : 0.5972, 잠재성 : 0.1251), ‘유비 쿼터스’(융합성 : 0.5972, 잠재성 : 0.1011), ‘빅데이터’(융 합성 : 0.5877, 잠재성 : 0.0986), ‘건강증진’(융합성 : 0.5526, 잠재성 : 0.0956)과 같은 상세 연구주제들이 상위권에 등 장하였다. 실제로 이와 같은 상세 연구주제들은 2015년의 융합 네트워크에서 융합 관계의 핵심에 위치할 뿐만 아니 라, 융합 관계의 매개체 역할 또한 활발히 수행하였다. 종 합적으로, 본 연구의 잠재성 지표가 다음 분석 구간의 융 합 관계 혹은 융합성과 밀접한 관련이 있음을 연도구간별 비교를 통해 확인할 수 있었다. 따라서, 2016년의 융합 네 트워크에서 ‘가치평가’, ‘관리시스템 구축’, ‘빅데이터’ 등 이 각각 0.1877, 0.1296, 0.0632의 높은 잠재성을 보였기 때문에, 가까운 미래의 융합 관계에서 해당 상세 연구주 제들이 핵심적인 역할을 수행할 것으로 예상한다.

    5. 결 론

    현존하는 학제 분야들의 대부분은 학문적으로 성숙기 에 이르렀고, 더 이상 내부지식으로는 학문적 발전이나 문제 해결이 어려운 시기에 도달했다. 이에 대한 대응책 으로, 국내를 비롯한 다양한 국가에서 연구들은 학제 분 야간 경계를 허물고, 융합하여 다양한 접근 방법을 시도 하는 추세이고, 국가기관들 또한 융합 연구를 적극 지원 하고 있다. 그럼에도 불구하고, 국내의 융합 연구에 초점 을 맞추어 동향을 분석한 연구는 부족한 실정이다. 따라서, 본 연구는 연구자들의 연구 계획이나 방향성이 여실히 반 영된 연구제안서를 통해 국내 학제간 융합 연구 동향을 분석하였다. 구체적으로, 본 연구는 대량의 연구제안서 데이터를 수집하여, 인문사회 분야와 과학기술 분야 간의 융합 연구를 구성하고 있는 상세 연구주제를 파악하고, 연도구간별 융합 관계의 변화 및 연구 동향을 살펴보았다.

    국내 융합 연구 동향을 모니터링하기 위해, 본 연구는 한국 연구 재단의 융합연구지원 사업에 제안된 연구제안 서 1,056건을 수집하였으며, 연구제안서로부터 연구의 주 제나 내용을 담고 있는 키워드를 추출하고 연구제안서를 구조화하였다. 다음으로, 토픽 모델링을 적용하여 40개의 상세 연구주제를 정의하였고, 연구제안서가 주로 다루는 상세 연구주제를 식별하였다. 또한, 연구제안서 내 상세 연구주제들의 동시 출현 관계를 파악하여, 융합 네트워크 를 구축하고, 시간의 흐름에 따라 변화하는 상세 연구주 제 간의 융합 관계를 분석했다. 생성된 융합 네트워크는 기존의 연구에서 활용된 통계 분석이나 시계열적 추이 분 석을 통해서는 파악하기 어려운 전체적인 구조와 융합 관 계의 세부적인 변화까지 한눈에 확인할 수 있다. 뿐만 아 니라, 근접 중심성과 매개 중심성과 같은 계량적 지표를 계산하여, 융합 네트워크 내 융합성이나 잠재성이 높은 상세 연구주제를 분석하였다. 이와 같은 지표들은 다음 분석 기간에 융합성이나 잠재성이 높을 상세 연구주제나 유망할 융합 관계를 예측하는데 활용할 수 있다.

    본 연구는 국내 연구자들의 연구 결과가 아닌, 연구 목표나 방향, 계획을 담고 있는 미래 지향적인 연구제안 서를 기반으로 동향분석을 실행하였다. 본 연구의 방법 론은 특허, 논문보다 빠르게 연구자들의 연구 동향이나 트렌드를 모니터링할 수 있다는 장점을 가진다. 또한, 본 연구는 한국연구재단의 학제간 융합연구지원 사업에 제 안된 연구제안서를 선별적으로 활용하였기 때문에, 인문 사회 분야와 과학기술 분야 간의 학제간 융합을 파악할 수 있다. 따라서, 본 연구의 분석 결과는 국내 연구자들에게 새로운 연구 방향 설정에 있어, 구체적인 인사이트를 제 공할 수 있고, 국가적 관점에서 전체적인 융합 R&D 동 향을 모니터링 할 수 있다는 장점을 지닌다.

    그럼에도 불구하고, 본 연구는 몇 가지 개선점과 그에 따른 추후연구가 존재한다. 우선, 연구제안서를 구조화 하는 과정에서의 불용어 선정 기준이나 토픽 모델링에서 의 최적 토픽 수를 선정하는 기준에 따라, 상세 연구주제 의 정의가 바뀔 수 있다. 또한, 연구제안서가 가질 수 있 는 유효 토픽을 선정하는 기준 또한 보다 과학적으로 접 근할 필요가 있다. 마지막으로, 본 연구는 토픽 모델링을 통해 상세 연구주제를 도출하고, 국내 융합 연구 동향을 파악하고자 하였는데, 인문사회 혹은 과학기술 분야의 토픽으로 구분하여 정하지 않아 정확한 융합동향을 파악 하지 못했다. 또한, 본 연구의 방법론은 일부 실행자의 개입이 필요한 과정이 포함되어, 연구동향의 모니터링 도구로써 다소 재현성이 부족하다는 한계를 지닌다. 즉, 이벤트 탐지 알고리즘, 다이나믹 토픽 모델링과 같은 최 신 알고리즘을 통해 지속적으로 연구 동향을 모니터링할 방법론을 고안할 필요가 있다.

    Acknowledgement

    This research was supported by Policy Research Service Project through the National Research Foundation of Korea (NRF) funded by the Ministry of Education(No. 2016- A431-0016).

    Figure

    JKISE-42-1-74_F1.gif

    Overall Procedure

    JKISE-42-1-74_F2.gif

    Collecting and Preprocessing Research Proposals

    JKISE-42-1-74_F3.gif

    (A) Defining Detailed Research Topics (B) Identifying Main Topics of Each Research Proposal

    JKISE-42-1-74_F4.gif

    Time-Series Trends of Number of Research Proposals Per Detailed Research Topic

    JKISE-42-1-74_F5.gif

    Convergence Network of Period(a-2011, b-2015)

    JKISE-42-1-74_F6.gif

    Centrality Analysis of Period 2011 and 2015

    Table

    Parts of Detailed Research Topics and their Main Keywords

    Parts of Detailed Research Topic’s Main Keywords and Descriptions

    Number of Research Proposals Per Each Detailed Research Topic

    Reference

    1. Berman, F.D. and Brady, H.E., NSF SBE-CISE workshop on cyberinfrastructure and the social sciences : National Science Foundation Arlington, 2005.
    2. Blei, D. and Lafferty, J., Text mining : Classification, clustering, and applications, chapter Topic Models, Chapman & Hall/CRC, 2009.
    3. Blei, D.M., Ng, A.Y., and Jordan, M.I., Latent dirichlet allocation, Journal of Machine Learning Research, 3(Jan), 2003, pp. 993-1022.
    4. Chowdhury, G.G., Natural language processing, Annual Review of Information Science and Technology, 2003, Vol. 37, No. 1, pp. 51-89.
    5. Curran, C.-S. and Leker, J., Patent indicators for monitoring convergence–examples from NFF and ICT, Technological Forecasting and Social Change, 2011, Vol. 78, No. 2, pp. 256-273.
    6. Galbraith, B. and McAdam, R., The convergence of ICT, policy, intermediaries and society for technology transfer : evidence from European innovation projects, Taylor & Francis, 2013.
    7. Geum, Y., Kim, C., Lee, S., and Kim, M.S., Technological convergence of IT and BT : evidence from patent analysis, Etri Journal, 2012, Vol. 34, No. 3, pp. 439-449.
    8. Hanneman, R.A. and Riddle, M., Introduction to social network methods, University of California Riverside, 2005.
    9. Ingersoll, G.S., Morton, T.S., and Farris, A.L., Taming text : how to find, organize, and manipulate it : Manning Publications Co., 2013.
    10. Jeong, B. and Yoon, J., Competitive intelligence analysis of augmented reality technology using patent information, Sustainability, 2017, Vol. 9, No. 4, p. 497.
    11. Jeong, B., Yoon, J., and Lee, J.-M., Social media mining for product planning : A product opportunity mining approach based on topic modeling and sentiment analysis, International Journal of Information Management, 2018.
    12. Jo, J.-H., Chung, Y.-T., Choi, S.-W., and Ok, C., Unstructured Data Quantification Scheme Based on Text Mining for User Feedback Extraction, Journal of Society of Korea Industrial and Systems Engineering, 2018, Vol. 41, No. 4, pp. 131-137.
    13. Karvonen, M. and Kassi, T., Patent citations as a tool for analysing the early stages of convergence, Technological Forecasting and Social Change, 2013, Vol. 80, No. 6, pp. 1094-1107.
    14. Kim, E., Cho, Y., and Kim, W., Dynamic patterns of technological convergence in printed electronics technologies : patent citation network, Scientometrics, 2014, Vol. 98, No. 2, pp. 975-998.
    15. Kim, J., Jeong, B., and Yoon, J., A Technology Planning Approach Based on Network and Growth Curve Analyses : the Case of Augmented Reality Patents, Journal of the Korean Institute of Industrial Engineers, 2016, Vol. 42, No. 5, pp. 337-351.
    16. Kim, T., Choi, H., and Lee, H., A Study on the Research Trends in Fintech using Topic Modeling, Journal of the Korea Academia-Industrial cooperation Society, 2016, Vol. 17, No. 11, pp. 670-681.
    17. Ko, N., Jeong, B., Choi, S., and Yoon, J., Identifying Product Opportunities Using Social Media Mining : Application of Topic Modeling and Chance Discovery Theory, IEEE Access, 2018, Vol. 6, pp. 1680-1693.
    18. Lee, D., Choi, H., Jeong, B., and Yoon, J., Monitoring Bio-fuel Technology Using Patent Text Mining, The Journal of Intellectual Property, 2018, Vol. 13, No. 1, pp. 285-312.
    19. Lee, J., Jeong, B., Ko, N., Oh, S., and Yoon, J., A Problem-Solution based Patent Text Mining Approach for Technological Competition Intelligence Analysis, The Journal of Intellectual Property, 2018, Vol. 13, No. 3, pp. 171-204.
    20. Lee, P.-C., Su, H.-N., and Chan, T.-Y., Assessment of ontology-based knowledge network formation by Vector- Space Model, Scientometrics, 2010, Vol. 85, No. 3, pp. 689-703.
    21. Lu, Y., Mei, Q., and Zhai, C., Investigating task performance of probabilistic topic models : an empirical study of PLSA and LDA, Information Retrieval, 2011, Vol. 14, No. 2, pp. 178-203.
    22. Miyazaki, K. and Islam, N., Nanotechnology systems of innovation-An analysis of industry and academia research activities, Technovation, 2007, Vol. 27, No. 11, pp. 661-675.
    23. No, H.J. and Park, Y., Trajectory patterns of technology fusion : Trend analysis and taxonomical grouping in nanobiotechnology, Technological Forecasting and Social Change, 2010, Vol. 77, No. 1, pp. 63-75.
    24. Oh, S., Choi, H., and Yoon, J., Monitoring Augmented Reality Technology Using Topic Modeling of Patents, Journal of the Korean Institute of Industrial Engineers, 2017, Vol. 43, No. 3, pp. 213-228.
    25. Park, E.L. and Cho, S., KoNLPy : Korean natural language processing in Python, In Proceedings of the 26th Annual Conference on Human & Cognitive Language Technology, 2014, pp. 133-136.
    26. Patel, U., Hatay, E., D’Arcy, M., Zand, G., and Fazli, P., Setting Up the Beam for Human-Centered Service Tasks, 2017, arXiv preprint arXiv : 1710.06831.
    27. Rafols, I. and Meyer, M., How cross-disciplinary is bionanotechnology? Explorations in the specialty of molecular motors, Scientometrics, 2007, Vol. 70, No. 3, pp. 633-650.
    28. Redman, C.L., Grove, J.M., and Kuby, L.H., Integrating social science into the long-term ecological research (LTER) network : social dimensions of ecological change and ecological dimensions of social change, Ecosystems, 2004, Vol. 7, No. 2, pp. 161-171.
    29. Schmidhuber, J., Deep learning in neural networks : An overview, Neural Networks, 2015, Vol. 61, pp. 85-117.
    30. Scott, J., Social network analysis : Sage, 2017.
    31. Takeda, Y., Mae, S., Kajikawa, Y., and Matsushima, K., Nanobiotechnology as an emerging research domain from nanotechnology : A bibliometric approach, Scientometrics, 2009, Vol. 80, No. 1, pp. 23-38.
    32. Wang, B., Liu, S., Ding, K., Liu, Z., and Xu, J., Identifying technological topics and institution-topic distribution probability for patent competitive intelligence analysis : a case study in LTE technology, Scientometrics, 2014, Vol. 101, No. 1, pp. 685-704.
    33. Wilson, E.O., Consilience : the unity of science, New York : Alfred A. Knopf., 1998.
    34. Yoon, B. and Park, Y., A text-mining-based patent network : Analytical tool for high-technology trend, The Journal of High Technology Management Research, 2004, Vol. 15, No. 1, pp. 37-50.