1. 서 론
4차 산업혁명의 빠른 발전과 함께 스마트팩토리는 제조업의 새로운 패러다임으로 확고히 자리매김하고 있다. 스마트팩토리는 정보통신기술(ICT), 사물인터넷(IoT), 인공지능(AI), 빅데이터 분석 등 다양한 첨단 기술을 융합하여 기존 제조 공정을 자동화하고, 실시간 데이터를 활용해 생산성을 극대화하며, 고객 맞춤형 생산을 가능하게 하는 혁신적인 시스템을 의미한다. 이러한 스마트팩토리의 도입은 전통 제조업의 한계를 완화하거나 해결하며, 글로벌 경쟁력을 강화하는 데 핵심적인 역할을 하고 있다.
스마트팩토리의 성공적인 구축과 운영을 위해서는 다양한 연구개발(R&D) 과제들이 수행되어야 하며, 이러한 과제들은 스마트팩토리의 기술적 및 경제적 성과를 좌우 하는 중요한 요소로 작용한다. 따라서, 연구개발과제의 효율성을 평가하고, 각 과제의 기여도를 분석하는 것은 스마트팩토리의 전략적 계획 수립에 매우 중요하다. 그러나, 연구개발과제의 목적, 효과, 그리고 다양한 성과 지표를 고려한 과제 평가를 수행하는 것은 복잡한 과업으로, 과제의 특성, 목표, 자원 투입, 그리고 결과 등을 종합적으로 고려할 필요가 있다.
특히 국가 연구개발과제는 연구 수행, 논문 및 특허와 같은 기술적 성과, 그리고 기술 이전 및 인력 양성과 같은 경제적 성과 달성 과정에서 선형적 기술혁신 이론 (linear model)에 따른 시간 지연을 겪는다. 더불어, 국가 주도의 연구개발 과제는 제한된 자원을 성과의 규모와 질을 모두 고려하여 투입해야 한다는 문제가 존재한다. 국가 연구개발 투자 목표는 효율성(efficiency)을 중시하며, 효율성이 낮은 과제를 식별하는 것은 정책 입안자들에게 중요한 관심사이다. 연구개발 과제의 비교 분석을 통해 성과가 높은 과제의 성공 요인을 다른 과제에 벤치 마킹(benchmarking)함으로써 투자의 효율성을 높이고자 하는 기대가 존재한다.
따라서 본 연구는 스마트팩토리 분야 연구개발(R&D) 과제에서 도출된 기술적 성과와 경제적 성과를 동시에 검토하고, 다양한 유형의 연구개발 과제의 효율성을 비교 분석하는 것을 목표로 한다. 이를 위해 연구개발과제의 데이터를 기반으로 토픽 모델링(topic modeling)을 활 용하여 스마트팩토리 관련 연구개발 주제를 식별하며, 자료포락분석(DEA)을 통해 각 주제별 효율성을 평가한다. 마지막으로, 비모수 통계 검정(non-parametric statistical test)을 통해 주제 간 효율성 차이를 비교한다.
우선, 토픽 모델링을 통해 대규모 텍스트 데이터를 분석하여 스마트팩토리 연구개발 과제를 주제별로 분류하고, 각 주제의 특징을 파악한다. 이를 통해 유사한 특성을 가진 과제들을 그룹화하고, 효율성 비교의 기초를 마련한다. 이후 DEA를 사용해 분류된 연구개발 과제 유형의 자원 투입 대비 성과를 평가하고, 상대적 효율성을 정량적으로 측정한다. 마지막으로, 비모수 통계 검정을 통해 주제 간 효율성 차이를 분석하고, 비교우위 또는 열위를 식별한다.
본 연구는 이러한 분석을 통해 스마트팩토리 연구개발 과제의 벤치마킹 자료를 제공하고, 정책적 성과 목표 달성을 위한 전략적 의사결정에 기여할 수 있는 근거를 제시한다. 더 나아가 스마트팩토리 도입 과정에서 집중 해야 할 연구개발 분야와 개선 방향을 제시하여, 보다 체계적인 연구개발 과제 평가 및 관리 방안을 마련할 수 있을 것으로 기대된다.
2. 선행 연구
2.1 스마트팩토리 R&D 데이터 기반 자료포락분석
자료포락분석(DEA)은 의사결정단위(DMU)의 효율성을 평가하기 위해 비모수적 방법을 사용하는 강력한 수단이다. 이는 구축된 최적의 프론티어(frontier)와 비교하여 각 DMU의 상대적 효율성을 측정하며, 특정 산업 영역에서 투입 대비 높은 수익을 창출하는 투자를 식별하는데 도움을 준다[5, 17].
1978년 Charnes, Cooper, 그리고 Rhodes가 도입한 이 같은 DEA는 교육, 은행업, 공공 서비스 등 다양한 분야에서 널리 활용되고 있다. 특히, Stewart[12] 연구에 따르면, DEA는 다기준의사결정(MCDM) 분야에서 유용한 해결 접근법을 제공하는 중요한 도구로 자리 잡았다. 기본적으로 DEA의 의사결정단위(DMU)는 MCDM의 여러 대안과 대응되며, DEA의 입력 및 출력 요소는 MCDM의 여러 성과 지표와 대응되고, DEA의 효율성 개념은 MCDM의 볼록 효율성(convex efficiency) 개념과 일치한다[4].
Park et al.[7] 연구에서는 정부 R&D의 다양한 투자안을 대상으로 전문가 의견인 정성적 방법을 함께 통합하 여 이론적이면서 실무적인 효율성 성과를 동시에 반영하는 방법을 새롭게 제안하였다. 이 연구에서는 DEA에 의한 이론적인 투자 효율성과 전문가 집단이 중요하게 고려하는 투자 방향을 근거로, 각 대안들에 대한 두 투자 효율성 간의 차이를 밝혀냄으로써 보다 효과적인 R&D 투자 전략을 수립하였다.
Lee et al.[3]의 연구는 DEA를 활용하여 국가 단위의 R&D 생산성을 측정하고, 특히 아시아 국가들의 R&D 정책에 대한 함의를 도출하였다. 이 연구는 이전 연구들과는 달리 DEA 방법론을 적용하여 R&D 생산성을 정량적으로 평가함으로써, 체계적이고 객관적인 분석을 제공 하였다. 이러한 접근법은 스마트팩토리 분야의 R&D 분석에도 유사하게 적용될 수 있으며, 각국의 R&D 활동이 얼마나 효율적으로 이루어지고 있는지를 평가하는 데 중요한 역할을 할 수 있다.
Wang et al.[14]의 연구는 중국 제조업체들을 대상으로 스마트팩토리 R&D 프로젝트의 효율성을 평가하기 위해 DEA를 활용하였다. 이 연구는 다양한 스마트팩토리 기술 분야에서의 R&D 효율성을 비교 분석하였으며, 특히 지역 간 차이를 고려하여 각 지역의 R&D 성과를 평가하였다. 연구는 DEA 분석을 통해 효율성이 높은 지역과 그렇지 못한 지역을 식별하고, 효율성 격차를 줄이기 위한 정책적 접근을 제안하였다.
2.2 스마트팩토리 R&D 데이터 기반 토픽 모델링분석
Wortmann et al.[15]은 Industry 4.0과 관련된 모델 기반 시스템 엔지니어링(MBSE)의 최신 동향을 논문 자료를 통해 체계적으로 분석하여, 해당 분야의 주요 특성을 도출하였다. 이 연구는 Industry 4.0에 대한 모델링 커뮤니티의 주요 관심사와 핵심 출판물을 식별하는 데 중점을 두었으며, 이는 스마트팩토리와 같은 4차 산업혁명 관련 기술의 발전 방향을 이해하는 데 중요한 통찰을 제공하였다.
Yang et al.[16]은 스마트팩토리 연구 동향을 파악하기 위해 토픽 모델링을 활용하여 미래 스마트팩토리 확산 전략을 제시하였다. 이 연구는 스마트팩토리가 4차 산업 혁명의 맥락에서 어떻게 도입되고 발전할 수 있는지에 대한 중요한 시사점을 제공했으며, 토픽 모델링을 통해 도출된 결과는 스마트팩토리 기술 확산 과정과 그에 따른 전략적 접근을 보다 명확히 이해하는 데 기여하였다.
토픽 모델링 기법 중 하나인 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)은 다양한 분야에서의 미론적 마이닝과 주제 추출을 위한 도구로 널리 사용된다. Jelodar et al.[2]은 LDA 기반 토픽 모델링을 추천 시스템에 적용하여, 추천 시스템의 구조와 그 응용 분야에 대한 분류 체계를 제시하였다.
Wang et al.[13]은 스마트 제조 분야에서 특허 분석을 위해 LDA를 활용하여 주제 기반 특허 분석을 수행하였다. 이를 통해 스마트 제조 기술의 추세를 파악하고, 기업이 기술 주제의 출현 수준에 따라 잠재적 기회를 탐색하는 방법을 제안하였다. 이 연구는 LDA가 기술 추세 분석과 기업 전략 수립에 있어 중요한 도구로 활용될 수 있음을 입증한 사례이다.
Parlina et al.[8]은 딥 오토인코더 기반 퍼지 C-평균 알고리즘을 제안하여, 스마트 지속 가능 도시 연구에서 떠오르는 주제를 추출하였다. 이 연구는 토픽 모델링을 통해 주제의 진화와 특성을 포착하기 위한 콘텐츠 분석의 중요성을 강조하며, 스마트 시티 연구에서 주제의 발전을 이해하는 데 중요한 통찰력을 제공하였다.
또한, Saheb and Saheb[9]은 지속 가능한 인공지능 연구에서 LDA와 래퍼 기반 차원 선택 접근법을 결합하여, 자연어 처리, 기계학습 모델, 그리고 Harris Hawks Optimizer(HHO)를 활용해 학술적 주제와 하위 주제를 식별하였다. 이 연구는 LDA가 맥락적 주제 모델링에서 유연하게 적용될 수 있음을 보여주었으며, 특히 에너지 분야에서 지속 가능한 AI 연구 동향을 이해하는 데 중요한 기여를 하였다.
Sharma et al.[10]은 스마트 시티 연구의 추세와 연구 경향을 예측하기 위해 LDA를 활용한 반자동 리뷰를 수행하였다. 이 연구는 스마트 시티 도메인 내에서 연구 추세를 이해하는 데 조직적인 리뷰의 필요성을 강조하였으며, 더 나아가 스마트 농업 연구에 LDA 토픽 모델링을 적용하여 17개의 연구 주제를 식별하고 스마트 농업의 연구 경로를 확장하였다. 이는 LDA가 제조업뿐만 아니라 다양한 도메인에서도 성공적으로 적용될 수 있음을 보여주는 중요한 사례이다.
2.3 주제별 효율성 비교분석
Wang et al.[13]은 스마트 제조 분야에서 DEA와 토픽 모델링 기법을 결합하여 주요 기술 주제의 효율성을 분석하였다. 이 연구는 특허 데이터를 기반으로 스마트 제조 기술 주제를 도출하고, 각 주제의 효율성을 비교하였다. 연구 결과, 특정 기술 주제가 다른 주제들보다 더 높은 효율성을 보였으며, 이는 기업이 자원 배분 시 우선순위를 설정하는 데 중요한 지표로 활용될 수 있음을 강조 하였다. 본 연구는 스마트팩토리 기술 개발에서 자원을 효율적으로 사용하기 위한 전략적 접근의 필요성을 제기하고 있다.
기존 연구들은 주로 스마트팩토리 R&D의 기술적 성과에 집중하거나, 지역별 또는 국가별 R&D 효율성 분석에 한정된 경향이 있었다. 예를 들어, Lee et al.[3]의 연구는 국가 단위에서 R&D 생산성과 효율성을 측정했으나, 기술적 성과와 경제적 성과를 종합적으로 분석하지 못한 한계를 가지고 있었다. 이들 연구는 R&D 성과를 정량적으로 평가하는 데 기여했지만, 경제적 성과와 기술적 성과의 상호작용을 충분히 고려하지 못하여 R&D 프로젝트의 전반적인 성과를 평가하는 데 제한적이었다.
또한, Wang et al.[13]의 연구는 특정 지역 또는 기술 주제의 효율성을 비교 분석하였지만, 주로 DEA를 통해 기술적 성과에만 초점을 맞추었고, 경제적 성과나 인력 양성 등의 추가적인 성과지표는 충분히 반영하지 않았다. 이는 연구개발 활동의 효율성을 보다 폭넓게 평가하는 데 있어 한계로 작용하였다.
더불어, 토픽 모델링을 활용한 Yang et al.[16]과 Wang et al.[13]의 연구는 스마트팩토리 기술 동향을 파악하는 데 유용했으나, 도출된 기술 주제들 간의 성과를 비교하거나 그 효율성을 정량적으로 평가하지 못한 한계가 있었다. 토픽 모델링 기법을 통해 식별된 기술 주제에 대한 후속 효율성 분석이 부족하여, R&D 프로젝트의 성과에 대한 더 깊이 있는 이해를 제공하지 못했다.
따라서 본 연구는 이러한 기존 연구의 한계를 극복하고자, 스마트팩토리 R&D 과제의 기술적 성과와 경제적 성과를 종합적으로 평가하는 새로운 접근을 시도한다. 이것은 연구개발의 다면적 성과를 고려한 포괄적 접근으로 단순 기술 발전뿐만 아니라 경제적 가치 창출을 다룬다는 점에서 차별화된다. Wang et al.[13]과 Yang and Liao[16]의 선행 연구와는 달리, 본 연구에서는 LDA 기반 토픽 모델링과 DEA를 결합하여 각 주제의 효율성을 정량적으로 비교한다. 이는 특정 주제가 자원 투입 대비 성과를 얼마나 달성하고 있는지를 비교하여 자원 배분의 우선순위를 설정하는 전략적 의사결정에 기여할 수 있다. 또한, 기존의 DEA 분석 방법은 효율성 평가를 위한 비모수적 방법으로, 평가 결과에 관한 일반화의 한계가 근본적으로 존재하고 있어, 기술 주제를 포함한 각 주제 간의 성과 차이를 일반화할 수 있다는 점에서 차별화된다. 따라서, 이 연구에서는 토픽 모델링을 통해 연구개발 주제를 분류한 후, DEA를 활용하여 각 주제의 효율성을 정량적으로 비교한다. 또한, 비모수 통계적 검정을 통해 주제 간 성과 차이를 분석함으로써, 기존 연구들보다 더 종합적이고 체계적인 성과 평가를 제시한다. 이러한 분석은 스마트팩토리 R&D 정책 수립에 있어 중요한 시사점을 제공할 것으로 기대된다.
3. 연구 방법론
3.1 연구방법론 설계
본 연구는 스마트팩토리 분야에서 기술 추세를 탐색하고, 연구개발(R&D) 프로젝트의 주제별 효율성을 비교 분석하며, 다양한 유형 간의 효율성 차이를 평가하기 위해 <Figure 1>과 같은 연구 프레임워크를 설계하였다.
먼저, Phase 1에서는 스마트팩토리 분야의 기술적 및 경제적 성과를 동시에 검토할 수 있는 데이터를 수집하고 구성한다. 이 단계의 목표는 신뢰할 수 있는 데이터셋을 구축하여 연구의 기초를 마련하는 것이다.
Phase 2에서는 수집된 데이터를 분석에 적합한 형태로 전처리한다. 이 과정에서는 결측값 처리와 불필요한 데이터 제거 등을 통해 데이터의 품질을 높여 이후 분석 과정에서 발생할 수 있는 오류를 최소화한다.
Phase 3에서는 LDA 토픽 모델링 기법을 적용하여 스마트팩토리 연구개발과제에서 다루는 주요 주제를 탐색한다. 토픽 모델링은 대규모 텍스트 데이터를 분석하여 연구과제를 주제별로 그룹화하고 각 그룹의 특징을 도출하는 데 효과적인 방법이다. 이를 통해 스마트팩토리 관련 연구개발과제를 유사한 특성을 가진 그룹으로 분류할 수 있다.
Phase 4에서는 DEA를 통해 그룹화된 연구개발과제 유형의 상대적 효율성을 평가한다. DEA는 투입 자원 대비 산출 성과를 비교하는 비모수적 방법으로, 각 연구개 발과제가 자원을 얼마나 효율적으로 활용했는지를 정량 적으로 분석할 수 있다.
Phase 5에서는 앞서 도출된 효율성 결과를 바탕으로, 주제 간의 비교우위 또는 비교열위를 평가하기 위해 비모수 통계적 검정을 수행한다. 이 검정 방법은 자료의 분포에 대한 모수적 가정을 하지 않기 때문에 주제 간 효율성 차이를 유연하게 검증할 수 있다.
마지막으로, Phase 6에서는 주제 간 효율성을 쌍대비 교(pairwise comparison)하여 스마트팩토리 연구개발 과제의 벤치마킹 대상과 정책적 성과 목표 달성을 위한 전략적 의사결정에 활용할 수 있는 자료를 제공한다. 이를 통해 연구개발 과제의 개선 방향과 전략적 집중 분야를 도출할 수 있을 것으로 기대된다.
3.2 토픽 모델링 분석
본 연구에서는 스마트팩토리 연구개발(R&D) 프로젝트의 주요 기술 주제를 탐색하고 분석하기 위해 토픽 모델링 기법을 사용하였으며, 분석 대상 필드는 과제명, 연구목표, 연구내용, 기대효과, 과제 한글키워드로 설정하였다. 분석에 앞서, 특히 연구목표, 연구내용, 기대효과 등의 데이터에는 비정형 텍스트가 포함되어 있어 이를 전처리하는 과정이 필요했다. 전처리 단계에서는 데이터 정제, 불필요한 데이터 제거, 누락된 데이터 처리, 텍스트의 정량화 작업을 수행하였다. 스마트팩토리 R&D 관련 문서 및 성과 논문 등의 비정형 텍스트 데이터를 구조화하기 위해 자연어 처리(NLP) 기법이 활용되었다.
텍스트 데이터 전처리 과정에서는 단어 토큰화, 불용어 제거, 스테밍(Stemming) 등을 통해 분석 가능한 데이터로 변환하였다. 이후, 스마트팩토리 R&D와 관련된 주요 명사를 추출하고, 불필요한 기호, 숫자, 구두점 등을 제거하여 텍스트를 정제하였다. 또한, 빈번히 등장하는 불용어(예: “및”, “또는”, “그리고” 등)를 제거하였다. 다음으로, 텍스트 데이터를 단어 단위로 토큰화한 후, 표제어 추출(Lemmatization) 과정을 거쳐 동일한 의미의 단어들을 통일시켰다. 마지막으로, 전처리된 단어들을 수치화된 벡터로 변환하여 LDA 토픽 모델링 분석을 위한 준비를 마쳤다.
토픽 모델링은 대규모 텍스트 데이터를 분석하여 숨겨진 주제를 식별하고, 문서가 특정 주제에 속하는지를 확률적으로 모델링하는 비지도 학습 방법이다. 본 연구에서는 LDA 기법을 사용하였으며, LDA는 문서 내의 단어 분포를 기반으로 주제를 도출하고, 문서가 여러 주제의 혼합물로 구성되어 있다고 가정한다. 도출된 주제는 각 주제에 속하는 단어들의 확률적 분포로 표현되며, 모델은 문서 내 주제 비율과 주제를 구성하는 단어들의 확률을 추정한다. 이를 통해 스마트팩토리 연구개발과제 문서에서 주요 주제를 도출하고, 해당 문서 내 주제별 비율을 추정하여 연구개발과제의 전략적 방향성을 탐색하였다.
주제 수를 결정하기 위해 혼란도(perplexity), 주제 일관성(topic coherence), 그리고 LDAvis 가시화 도구를 사용하였다. 이를 통해 토픽별 단어 분포와 토픽 간 유사성을 확인하여 최종적으로 분석에 적합한 주제 수를 결정하였다.
1
여기서,
일반적으로 깁스 샘플링 과정에서 반복 횟수가 증가할수록 혼란도는 감소하는 경향을 보인다. 그러나 일정 시점 이후에는 혼란도가 더 이상 감소하지 않고, 증가와 감소를 반복하며 변동하는 구간이 나타난다. 이 지점이 수렴 지점으로 확인되면 샘플링을 중지하며, 이때의 혼란도가 해당 모델의 최종 혼란도가 된다. 혼란도가 낮을수록 토픽 모델은 실제 문서 결과를 잘 반영하며, 학습이 적절히 이루어졌다고 평가할 수 있다.
주제 일관성은 Newman[8]이 제안한 방법으로, 토픽 모델링 결과로 도출된 주제들에서 상위 N개의 단어를 추출한 후, 상위 단어들 간의 유사도를 계산하여 해당 주제가 의미론적으로 일관된 단어들로 구성되었는지 확인하는 방식이다.
LDAvis 가시화 도구는 2020년에 Alteryx Intelligence Suite(AIS)의 일부로 Designer에 토픽 모델링 도구가 추가되면서 공개된 도구이다. 이 도구는 막대차트와 주제 간 거리 맵이라는 두 가지 시각화 요소를 포함한다. 막대 차트는 전체 코퍼스에서 용어의 총 빈도를 나타내며, 주제 간 거리 맵은 주제에 포함된 가장 중요한 단어들을 시각적으로 보여준다. 특히 막대차트에서는 각 주제별로 상위 30개의 연관 단어가 가시화되며, 이때 단어를 추출하는 기준으로 Chuang et al.[2]이 제안한 Saliency와 Sievert & Shirley[12]가 제시한 Relevance 지표가 사용된다. 이 지표는 LDA 토픽 모델에서 사용되는 매개변수로, 토픽에 연관된 용어를 순위화 할 때, 두 가지 측면에서 균형을 맞추는 역할을 수행하는데, 첫 번째는 확률기반 순위로 특정 토픽 내에서 용어가 얼마나 자주 등장하는 지를 나타낸다. 두 번째는 리프트(Lift) 기반 순위로 해당 용어가 전체 코퍼스에서 얼마나 독특한지를 나타낸다. 이때 람다(λ)가 1일 때에는 용어가 해당 토픽에서 나타나는 확률만을 기준으로 순위화하며, 0일 때에는 리프트(Lift) 즉 해당 용어가 다른 주제에 비해 특정 토픽에 얼마나 특화되어 있는지를 기준으로 순위화 한다. 따라서 람다값은 확률과 리프트를 동시에 고려하여 균형을 맞추게 되며, 0과 1사이 범위값에서 설정된다. 따라서, 분석자는 이 두 지표를 기반으로 주제의 개수를 조정하면서 결과를 확인하고, Saliency와 Relevance의 중요도를 적절히 조정하여 최적의 주제별 단어를 반영한다.
3.3 자료포락분석
본 연구에서는 스마트팩토리 연구개발 프로젝트의 효율성을 평가하기 위해 자료포락분석 기법을 활용하였으며, 각 R&D 프로젝트를 DMU로 간주하여 프로젝트의 자원 활용 효율성을 비교 분석하였다.
DEA는 Charnes, Cooper, 그리고 Rhodes에 의해 개발 된 방법론으로, 각 DMU의 효율성을 평가하기 위해 선형 프로그래밍 기법을 사용한다. 이 분석은 특정 DMU가 주어진 투입 자원을 얼마나 효과적으로 사용하여 결과물(산출)을 생산하는지를 평가하는 데 중점을 둔다. 효율성은 0에서 1 사이의 값으로 표현되며, 1에 가까울수록 해당 DMU는 자원을 효율적으로 활용하고 있음을 의미한다.
본 연구에서 DEA 효율성 평가할 때 Banker, Charnes, 그리고 Cooper가 제안한 BCC 모델 사용하였다. 이 모델은 가변규모수익(Variable Returns to Scale, VRS)을 가정하며, 이는 DMU가 입력 자원을 증가시킬 때 산출물이 비례적으로 증가하지 않을 수 있음을 허용하는 모델이다. 또한 DEA 모델 구성시 입력지향(input-oriented) 모델과 출력지향(output-oriented) 모델을 구분하여 모델링이 가능한데, 본 연구에서는 출력지향 모델링을 적용하였으며, 이는 입력 자원을 사용하여 산출을 최대한 늘리는 것에 중점을 둔 모델이다. 효율적인 DMU는 동일한 자원으로 더 많은 성과(출력)를 달성하는 것을 목표로 한다. 이는 정부 R&D 사업은 자원 투입을 최소화하기보다 성과를 최대화하는 것을 목표로 하고 있어, 연구개발 과정에서 투입 자원(예산, 인력 등)이 고정된 상태에서 최대한의 성과(논문 특허 등)를 산출하는 것이 목표이기 때문이다.
DEA 분석 시에 DMU의 효율성을 평가하기 위한 적절한 입력 변수와 출력 변수를 선택하는 것이 중요하다. 본 연구에서는 스마트팩토리 연구개발 프로젝트를 각 DMU로 간주하며, 입력 변수로는 총연구비_현금, 총연구비_ 현물 2개 지표를 사용하였고, 산출 변수는 기술적 성과와 경제적 성과 지표인 논문성과수, 특허성과수, 기술료 성과수, 연구인력 양성수(박사 인력, 석사 인력, 학사인력) 5개 지표를 사용하였다.
결과적으로 본 연구에서 스마트팩토리 연구개발 프로젝트들의 주제들에 대한 효율성을 비교 분석하기 위해 수립한 출력지향 BCC DEA 모델은 아래와 같다.
목적함수:
제약조건:
여기서 λj는 DMU j의 가중치를 의미하며, θ는 평가 중인 DMU의 효율성 점수, ∈는 임의의 작은 양수 (non-Archimedean 값, ∈ > 0)를 의미한다. 이 산식을 근거로, 각 DMU (xio, yro) 별로 산출지향 효율성 θ 값을 반복적으로 계산하며, 결과적으로 본 연구에서의 효율성의 의미는 투자되는 연구개발비의 총합 대비 이로 인해 달성되는 논문성과 수, 특허성과 수, 인력양성 규모, 기술이전료 규모(기술사업화 수)의 총합의 상대적 비율을 나타낸다.
3.4 비모수 통계 검정
앞서 분석된 스마트팩토리 연구개발 프로젝트들의 각 주제 그룹들을 대상으로 효율성에 대한 비모수 통계 검정을 수행하였다. 기본적으로 효율성 값들의 확률분포는 비모수적인 경향이 많다. 본 연구에서는 주제 집단간의 확률분포가 상이한지, 만약 상이하면 어느 주제 집단이 타 집단에 비해 비교우위 또는 열위에 있는지를 확인하기 위하여 비모수 통계 검정을 수행하였다. 이때 활용한 검정 기법은 Kruskal-Wallis(K-W) Test, 그리고 Dunn- Bonferroni(D-B) Test이다. K-W 검정은 세 개 이상의 독립적인 그룹 간의 중앙값 차이를 비교하는 비모수 검정 방법이다. 이는 ANOVA의 비모수 버전으로, 데이터가 정규 분포를 따르지 않거나 등분산성을 만족하지 않을 때 사용된다. D-B 검정은 K-W 검정에서 유의미한 차이 가 있는 경우 개별 그룹 간 차이를 확인하기 위해 사용되는 사후검정(post-hoc test이다. 이 검정은 다중 비교 문제를 해결하기 위해 Bonferroni 보정을 적용하여 유의수준을 조정한다.
결과적으로 미모수 통계 검정을 통해 스마트팩토리 연구개발 프로젝트의 각 주제별 효율성이 통계적으로 동일한 분포 경향을 띄는지, 어느 주제의 효율성이 상대적으로 비교우위 또는 열위 경향을 보이고 있는지를 확인 할 수 있으며 이를 분석하였다.
4. 연구실험 비교분석
4.1 데이터 구성
스마트팩토리 연관 데이터를 검색하기 위해서 한국국가과학기술지식정보서비스(NTIS)에서 제공하고 있는 데이터 검색 시스템을 활용하였다. 이때 검색 기간은 2000년부터 2022년까지 23년 동안에 등록된 스마트팩토리 분야에 R&D 과제 데이터를 대상으로 하였으며, 스마트 팩토리 분야 연관 검색을 위한 핵심어와 검색식은 <Table 2>와 같이 구성하였다.
NTIS에서 제공 중인 필드 데이터에서 과제고유번호, 제출년도, 연구목표, 연구내용, 기대효과, 과제 한글 키워드, 과제 영문 키워드를 대상으로 하였으며, 과제 영문 키워드를 대상으로도 검색을 수행하기 위하여 영문 키워드를 추가하여 검색어를 구성하였다. 이와 같은 검색어 및 검색식을 근거로, 스마트팩토리 부문의 연관 R&D 과제 데이터를 검색한 결과, 총 48,049건이 분석되었다.
이와 더불어 해당 과제로부터 유발된 기술적 성과와 경제적 성과 데이터를 추가로 구성하였으며, 기술적 성과 중 논문성과는 총 95,648건, 특허성과 129,730건이 확인되었고, 경제적 성과 중에 기술료 성과 52,867건, 인력 양성 성과 중에 박사 3,492명, 석사 19,174명, 학사 24,021명, 기타 인력 2,044명으로 확인되었다.
본 연구에서는 스마트팩토리 분야의 연구개발과제 수행의 유형을 1) 사업관리 전담 부처별, 2) 연구과제 수행 주체의 유형별, 3) 연구개발 단계별, 그리고 4) 과제 수행 지역별로 구분하여 해당 유형에 따른 효율성의 경향을 비교분석 하고자 하였다.
먼저, 스마트팩토리 연구개발 과제 관리를 전담하는 부부처를 분석한 결과는 <Figure 2>, 연구과제 수행 주체를 분석할 결과는 <Figure 3>, 연구개발 단계별 분석 결과는 <Figure 4>, 마지막으로 과제 수행 지역별 분석 결과는 <Figure 5>와 같이 나타났다.
이처럼 중소벤처기업부(중소기업청 포함)는 17,172건 (25,095.5억 원)으로 가장 많은 연구개발 과제를 관리하고 있으며, 이는 중소기업 지원이 스마트팩토리 연구개발의 중심축임을 나타내며, 소규모 기업을 통한 혁신 촉진을 목표로 하고 있는 것으로 분석되었다. 과학기술정보통신부(미래창조과학부 포함)는 10,830건(45,055억 원)으로 가장 큰 예산을 관리하며, 이는 과학기술 및 정보통신 기술 기반의 대규모 연구개발 과제에 집중하고 있음을 보여주고 있다. 산업통상자원부는 6,966건(59,976.9억 원)으로 상대적으로 적은 과제 수에 비해 매우 큰 예산을 관리하고 있으며, 이는 대형 프로젝트가 산업통상자원부 주도로 이루어지며, 산업기반 연구에 자원이 집중 되고 있음을 보여주고 있다.
연구 수행 주체별 분석에서는 중소기업이 가장 많은 과제를 수행하고 있지만, 예산 측면에서는 출연연구소와 대기업이 수행하는 과제에 더 큰 규모의 예산이 투입되고 있다. 중소기업이 24,146건의 과제를 수행한 반면, 대기업은 569건만 수행했음에도 불구하고 대기업의 과제 당 예산은 상당히 큰 규모에 해당된다. 출연연구소는 비교적 적은 수의 과제를 수행하고 있지만, 예산의 상당 부분을 차지하고 있으며, 이는 고급 기술 및 전략적 연구가 출연연구소 중심으로 이루어지고 있음을 보여주고 있다.
연구개발 단계별 분석에서는 개발연구에 가장 많은 자원이 투입되고 있으며, 이는 스마트팩토리 기술이 상용화 단계에 있음을 나타내고 있다. 개발연구(28,281건, 98,167.9억 원)는 기초연구나 응용연구보다 우선적으로 추진되고 있음을 보여주며, 실제 산업적 활용이 목표인 과제가 다수이다. 응용연구는 5,838건(35,830.1억 원)으로 기초연구보다 예산 규모가 크며, 이는 혁신적인 기술의 응용 및 상용화 가능성이 높다는 점을 반영한 것으로 보인다.
연구과제 수행 지역별 분석에서는 서울특별시와 경기도가 각각 11,305건(35,254.7억 원), 10,065건(36,296억 원)으로 스마트팩토리 연구과제 수행의 중심 지역으로 나타났다. 특히 경기도는 서울과 비슷한 수준의 과제를 수행하면서도 예산이 더 많이 투입되었으며, 대전광역시는 4,745건 (30,808.7억 원)으로 과제 수 대비 예산이 높으며, 이는 출연 연구소와 대기업이 집중된 연구개발 허브로서의 역할을 하고 있음을 보여주고 있다. 이외에 주요 지방 도시 중에서 영남권 지역(부산, 대구, 경남, 경북)이 일정 비중의 연구개 발을 담당하고 있으며, 수도권 중심의 연구개발 활동이 상대적으로 활발함을 시사하고 있다.
4.2 스마트팩토리 R&D 과제의 토픽 모델링 분석
앞서 분석된 총 48,049건의 스마트팩토리 연구개발 프로젝트 데이터를 대상으로 토픽 모델링 기법 중 LDA를 사용하여 각 주제들을 분석하였다. 이때 주제의 개수를 결정하기 위하여 2단계를 거쳐 분석하였다. 첫 번째 단계에서는 혼란도와 주제 일관성 지수를 활용하였으며, 두 지표를 활용한 결과가 <Figure 6>과 같이 분석되었으며, 주제 개수를 13개로 선정하였다.
이때 λ 값을 선행 연구[12]의 지침에 따라, 0.6값에서 부터 시작하여 추가로 조정(0.61 최적치)해가면서 각 주제별 키워드를 결정하였다. 이처럼 3가지 방법을 함께 활용하여 스마트팩토리 분야 주제를 분류하였으며 분석 결과 일부는 <Figure 7>, <Figure 8>과 같다.
위 그림에서 가로축 PC1은 주성분1을, 세로축 PC2는 주성분2를 의미하며, 이는 토픽 간의 거리를 주성분 분석(PCA)으로 차원 축소하여 시각화한 결과를 나타낸다. 여기서 원의 크기는 해당 토픽이 전체 데이터에서 차지하는 비중을 나타내며, 원이 클수록 해당 토픽이 문서들 사이에서 더 빈번하게 등장한다는 것을 의미한다. 그리고 원 내부의 번호는 토픽 번호를 나타낸다.
LDA 분석을 통해 분석된 각 주제는 스마트팩토리의 특정 기술 영역을 대표하며, 주요 핵심어들이 <Table 3> 과 같이 분석되었다.
이처럼 스마트팩토리 연구개발 프로젝트의 주제가 센서 및 무선 통신 기술에서부터 바이오 및 환경 기술에 이르기까지 다양한 형태로 연구개발이 진행된 것으로 확인되었다. 다만 해당 분야에서 중요한 기술적 요소와 추 세를 고려했을 때, 일부 주제는 스마트팩토리와 직접적인 관련이 깊지만, 몇 가지는 특정 산업 및 관련 분야에 더 적합한 주제로 보인다. 특히 소재 및 나노기술(Topic 6)은 소재나 나노 기술이 특정 제조 공정에서 중요할 수 있지만, 스마트팩토리 전체 시스탬과는 약간은 거리가 있을 수 있다. 자율 주행 및 교통 시스템(Topic 8)은 물류 자동화 시스템과 일부 관련성이 존재할 가능성이 있으며, 디지털 콘텐츠 및 가상현실 기술(Topic 9)은 스마트팩토리에서 운영 교육, 시뮬레이션 등에 사용될 가능성이 높다. 의료 및 건강 관리 시스템(Topic 11)은 헬스 케어 분야에 보다 연관성이 높은 주제로 보이며, 바이오 및 환경 기술(Topic 12)은 특정 제조 공정과 연관성이 있을 수 있지만, 스마트팩토리의 주요 초점과는 약간은 거리가 있어 보인다. 하지만 스마트팩토리 분야에서 국가 연구개발 프로젝트들이 다양한 영역에서 광범위하게 수행되어 온 점을 고려할 때, 해당 주제 분류가 연관성이 없다고 보기는 어렵다.
4.3 스마트팩토리 R&D 과제의 주제별 효율성 분석
본 연구에서는 스마트팩토리 R&D 연구 과제에서 수행된 12개의 주제 그룹(T1부터 T12까지)을 대상으로 효율성 점수를 비교 분석하였다. 각 연구개발과제의 효율성은 스마트팩토리 내에서 기술 도입 및 적용의 성공 여부를 평가하는 중요한 척도이다. 각 그룹은 상이한 연구 주제를 중심으로 분석이 진행되었으며, 이로 인해 효율성 점수에도 유의미한 차이가 나타났다.
<Table 4>의 평균 효율성 측면에서는 “산업 및 기업 지원 전략” (T3)과 “디지털 콘텐츠 및 가상현실 기술” (T9)은 각각 25.5와 23.7로 상대적으로 높은 평균 효율성 값을 보이고 있어, 이들 분야가 평균적으로 높은 산출 효율성을 가지고 있는 것으로 나타났다. 반면, “클라우드 및 네트워크 보안 서비스” (T4)는 평균 효율성이 15.4로 가장 낮아, 산출 성과를 개선할 여지가 있을 수 있다. 효율성의 변동성 측면에서 효율성의 표준 편차가 “설계 및 성능 검증 기술” (T5)에서 14.4로 가장 높아, 이 분야에서 효율성 값의 변동이 크다는 것을 알 수 있다. 반대로, “클라우드 및 네트워크 보안 서비스” (T4)는 9.5로 가장 낮은 표준 편차를 보이며, 이 분야의 효율성이 비교적 일정하게 유지되고 있음을 시사하였다. 효율성 범위 측면에서 모든 토픽에서 최소값과 최대값의 차이가 42~43으로 유사하게 나타나, 각 분야에서 효율성의 전체 범위는 일관성이 있는 것으로 분석되었다.
4.4 비모수 통계적 검정
4.4.1 주제별 효율성 비교분석을 위한 검정
본 연구에서는 K-W 검정을 통해 스마트팩토리 R&D 프로젝트의 12개 주제 그룹 간 효율성 점수를 비교 분석 하였으며, 이어 D-B 검정을 통해 각 주제 그룹 간의 구체적인 차이를 다중 비교하였다.
먼저, K-W 검정의 결과, 카이제곱 통계량은 2471.36으로 계산되었으며, 자유도(df)는 11, p-값은 0으로 나타났다. 이는 12개 주제 그룹 간 효율성 점수 분포에 유의미한 차이가 존재함을 강하게 시사한다. 즉, 최소한 한 쌍 이상의 연구 그룹 간에 효율성 점수 분포에 차이가 있음을 의미하며, 각 그룹 간의 구체적인 차이를 분석할 필요성을 제기한다.
D-B 검정은 각 주제 그룹 간의 쌍대비교(pair-wise comparison)를 통해 효율성 점수 간의 차이를 분석하였으며 결과는 <Table 5>와 같이 나타났다.
본 연구에서는 T1 주제부터 T12 주제까지 두 주제 간의 효율성에 대한 비교우위 또는 비교열위 상태를 분석하기 위하여 Bonferroni에 의해 조정된 P-value인 P.adj 값을 근거로 0.05 이하면 두 그룹 간의 유의한 차이가 있다고 판단하고, 이후 Z값을 기준으로 양수일 때 Group1에 속한 주제 그룹이 Group2에 속한 주제 그룹 보다 비교우위에 있는 것으로 판단하였다.
또한 Z의 절대값을 토대로 16.30(66.6번째 백분위수) 이상인 경우엔 매우 강한 차이 (“≫” 또는 “<<”), 9.26~16.30인 경우에 강한 차이(“>” 또는 “<”), 그리고 9.26(33.3번째 백분위수) 미만인 경우에 약한 차이(“)” 또는 “(”)가 존재하는 것으로 판단하였다. 종합하면, T3 > T4 ≫ T10 ) T11 > T5 ) T1 ) T12 ) T2 ) T6 ) T7 ) T8 > T9와 같이 정리되었다. 결과적으로, 산업 및 기업전략 (T3)과 클라우드 및 네트워크 보안 서비스(T4) 주제 효율성이 타 주제 대비 매우 강한 비교우위에 있는 것으로 확인되었으며, 에너지 및 전력 시스템(T10), 의료 및 건강 관리 시스템(T11), 설계 및 성능 검증 기술(T5), 센서 및 무선통신기술(T1), 바이오 및 환경 기술(T12), 데이터 분석 및 기계학습 알고리즘(T2), 소재 및 나노 기술(T6), 자동화 및 품질 관리 기술(T7) 주제 순서대로 상호 간 강한 비교우위에 있는 것으로 확인되었다. 그리고 자동화 및 품질 관리 기술(T7)이 자율 주행 및 교통 시스템 (T8)보다 매우 강한 비교우위에 있으며, 마지막으로 자율 주행 및 교통 시스템(T8)이 디지털 콘텐츠 및 가상현실 기술(T9) 보다 강한 비교우위에 있는 것으로 분석되었다.
4.4.2 유형별 효율성 비교분석을 위한 검정
본 연구에서는 연구개발과제 유형에 따른 효율성 비교분석을 추가로 수행하였다. 앞서 설명한 4가지의 유형을 구분하여 각각 유형별 효율성을 비교 분석하였으며, 이때 각 유형에 따른 다양한 기준 그룹들간의 유의미한 차이가 있는지 여부를 검정하기 위해 K-W 검정을 수행하였고, 유의미한 차이가 있는 경우 사후검정으로 그룹 간의 차이를 비교 검정하는 D-B 검정 방법을 동일하게 활용하였다.
<Table 6> 분석 결과에서처럼, 4가지 유형에 따른 다양한 기준 그룹들 간에 유의미한 차이가 있는 것을 확인 하였다. 사업관리 전담 부처는 중소벤처기업부를 비롯해 총 40개 부처가 있으며, 연구과제 수행 주체 유형은 대기업, 대학, 중소기업, 출연연구소, 기타, 국공립연구소, 중견기업, 정부 부처 총 8개 유형, 연구개발 단계 유형은 개발연구, 응용연구, 기초연구, 기타 총 4개 단계, 연구개발 수행지역은 서울특별시를 비롯해 총 18개 지역이다. 이와같이 다양한 유형에 따른 기준 그룹들간의 어떻게 차이가 존재하고 있는지 사후검정을 수행하였다.
사업관리 전담 부처의 경우에 검정 통계량 Z 절대값 의 33.3 백분위수가 6.04, 66.6 백분위수가 11.48로 분석 되고, 연구개발 수행 주체 유형은 33.3 백분위수가 8.22, 66.6 백분위수가 16.10, 연구개발 단계 유형은 33.3 백분 위수가 14.53, 66.6 백분위수가 44.28, 연구개발 수행 지 역은 33.3 백분위수가 5.74, 66.6 백분위수가 9.54로 분석 되었다. 이 값들을 근거로 매우 강한 차이, 강한 차이, 약 한 차이로 등급 고려하여 비교우위 또는 열위상태를 분 석하였다.
결과적으로 <Table 6>부터 <Table10>에서처럼, 같은 유형별 효율성 비교분석을 위한 사후검정 결과, 사업관 리 전담 부처는 산업통상자원부 ≫ 중소벤처기업부 ≫ 국토교통부 ≫ 방위사업청 ≫ 기상청 ≫ 교육과학기술부 ≫ 교육부 ≫ 산림청 ≫ 국토해양부 ≫ 농촌진흥청 ≫ 문화재청 ≫ 보건복지부 ≫ 지식경제부 ≫ 다부처 ≫ 특 허청 ≫ 범부처 사업이며, 연구과제 수행 주체 유형은 중 소기업 ≫ 대학 ≫ 출연연구소 ≫ 중견기업 ≫ 국공립연 구소 ≫ 대기업 ≫ 기타 ≫ 정부부처, 연구개발 단계 유 형은 개발연구 ≫ 기초연구 ≫ 응용연구 = 기타, 마지막 으로 연구개발 수행 지역은 기타 ≫ 서울특별시 ≫ 부산 광역시 ≫ 전라북도 ≫ 충청남도 ≫ 충청북도 ≫ 인천광 역시 ≫ 대전광역시 ≫ 대구광역시로 분석되었다.
이번 연구의 결과는 연구개발 사업의 주요 관리 부처와 수행 주체, 그리고 연구개발 단계와 수행 지역별 투입 대비 산출 효율성에 관한 비교우위를 명확하게 보여주고 있다.
산업통상자원부와 중소벤처기업부가 연구개발 사업 관리에서 매우 강한 영향력을 행사하고 있음이 확인되었다. 이들 부처는 다른 부처에 비해 비교적 높은 사업 관리 역량과 자원 배분을 보이고 있으며, 이는 해당 부처들이 국가적 R&D 사업을 선도하고 있다는 점을 나타낸다. 방위사업청, 기상청 등 중간 수준의 부처들도 일정한 역할을 수행하고 있지만, 하위 부처들의 경우 보다 적극적인 역할 강화 및 정책적 지원이 필요할 가능성이 높다. 특히, 범부처 사업의 경우 다양한 부처가 연계되는 특성상 통합적 관리 시스템이 강화될 필요가 있음을 시사한다.
중소기업이 대학, 출연연구소 등 다른 주체들에 비해 더 우위에 있는 연구 수행 주체로 나타났다. 이는 정부가 추진하는 다양한 R&D 정책에서 중소기업에 대한 지원이 성공적으로 작동하고 있음을 시사하며, 향후 중소기업의 혁신 역량을 더욱 확대할 필요가 있음을 보여준다. 또한, 대학과 출연연구소도 여전히 중요한 역할을 하고 있지만, 국공립연구소와 대기업의 참여는 상대적으로 저조한 것으로 나타나, 이들 주체의 역할 강화가 필요할 것 으로 예상된다.
연구개발 단계별 특성에서 개발연구가 기초연구와 응용연구보다 우위를 점하고 있으며, 이는 정부와 산업계 가 실용적이고 기술적 완성도를 높이는 데 중점을 두고 있음을 나타낸다. 하지만 기초연구와 응용연구의 중요성 또한 간과되어서는 안 된다. 특히 응용연구는 혁신적인 아이디어가 실질적인 제품이나 서비스로 발전하는 중간 단계로, 이에 대한 지원도 확대될 필요가 있을 것으로 예 상된다.
연구개발 활동이 기타 지역을 포함하여 서울특별시, 부산광역시와 같은 대도시에 집중되어 있다는 결과는, 지역 간 연구개발 불균형을 보여준다. 이는 대도시 외의 지역에서의 R&D 투자 확대가 필요함을 시사한다. 특히, 수도권 중심의 연구개발 활동이 지속되면 지역 혁신 격차가 심화될 수 있으며, 이를 해결하기 위한 정책적 접근이 필요할 것으로 예상된다.
5. 결 론
본 연구에서는 DEA와 LDA 기법을 결합하여 스마트 팩토리 연구개발(R&D) 프로젝트의 성과와 기술 주제를 종합적으로 분석하였다. 이는 스마트팩토리 R&D 프로젝트가 기술적 발전뿐 아니라 경제적 가치 창출을 통해 산업 전반에 미치는 영향을 종합적으로 평가했다는 점에서 큰 의의가 있다. 기술 성과와 경제 성과의 동시 평가를 통해 정책 입안자는 연구 투자 우선순위를 명확히 설정할 수 있으며, 이는 효율적인 자원 배분 전략의 기초를 제공한다. 구체적으로는 LDA 방법을 통해 스마트팩토리 분야에서 중요한 기술 주제를 도출하고, 각 기술 주제의 상대적 중요성을 평가함으로써 향후 연구 방향과 정책적 우선순위를 제시하였다. 특히 LDA 분석 결과, 스마트 제조, 자동화, 인공지능 등과 관련된 기술 주제가 가장 큰 비중을 차지하였으며, 이는 스마트팩토리 기술 발전의 핵심 축임을 드러냈다. 디지털 트윈, 사물인터넷(IoT), 빅데이터 분석 기술이 빠르게 발전 중인 것으로 나타났으며, 이러한 기술은 제조 프로세스 최적화와 자원 효율성 증대에 중요한 기여를 하고 있다.
또한, 사업 관리 기관 및 연구 수행 주체 간의 성과를 DEA와 비모수 통계 검정인 K-W 검정과 D-B 검정을 결 합하여 DEA 분석 결과에 대한 일반화의 근본적 한계를 보완한 점은 학술적 기여가 높을 것으로 기대된다. 이러 한 접근방법을 토대로 분석한 결과, 산업통상자원부가 가장 효율적인 성과를 보였으며, 중소벤처기업부와 국토교통부가 그 뒤를 따랐다. 연구 수행 주체 중에서는 중소 기업이 높은 효율성을 보여 스마트 팩토리 혁신에서 중요한 역할을 하고 있음을 확인할 수 있었다. R&D 단계 에서는 개발연구가 기초연구와 응용연구에 비해 더 큰 비중을 차지하고 있으며, 이는 스마트팩토리 기술이 상용화 및 응용 중심으로 빠르게 전환되고 있음을 시사한다. 지역적으로는 비수도권 지역이 서울, 부산 등 대도시와 함께 스마트팩토리 연구개발에서 중요한 기여를 하고 있는 것으로 나타났다. 연구개발비 투입 측면에서는 서울, 경기, 대전, 부산, 경북, 경남, 대구 순으로 많은 투입이 이루어져 왔지만, 효율성 비교분석에 의한 종합적 성과 측면에서는 서울, 부산, 전북, 충남, 충북, 인천, 대전, 대구 순으로 분석되어 연구개발비 투입 대비 성과 창출의 경향이 비례적이지 않은 것으로 나타났다. 또한 이는 연구개발 성과가 특정 대도시에 편중되지 않고 전국적으로 균형 있게 확산될 필요가 있음을 의미한다. 스마트팩토리 발전을 위해서는 지역 간 연구 인프라와 자원 배분의 균형을 맞추는 정책적 노력이 필수적이며, 다른 비수도권 지역의 연구 활성화는 국가 전체의 지속 가능한 성장을 위한 중요한 요소로 작용할 것이다.
결론적으로, 본 연구는 스마트팩토리 기술 주제와 연구 효율성을 종합적으로 평가함으로써 미래 스마트팩토리 발전 방향에 대한 전략적 시사점을 제공한다. 특히 AI, IoT, 빅데이터 등 스마트 제조 혁신 기술을 우선시하고, 중소기업을 중심으로 한 지원 정책을 강화할 필요가 있다. 중소기업의 높은 효율성은 스마트팩토리 혁신의 핵심 동력임을 실증적으로 보여준다. 따라서 정책적 자원을 중소기업 혁신에 집중하는 것은 국가 경쟁력 강화의 필수 전략임을 시사하며, 향후 스마트팩토리 연구개발 지원 정책이 중소기업 역량 강화에 초점을 맞추는 것이 필요하다.
결과적으로, 이번 연구는 스마트팩토리 분야에서 R&D 사업 관리 및 수행의 구조적 특징을 명확하게 드러냈다. 첫째, 사업 관리 부처 간의 역할 차별화를 고려한 정책 설계가 필요하며, 둘째, 중소기업을 중심으로 한 연구 과제 수행 주체의 역량 강화를 지속적으로 추진해야 한다. 셋째, 연구개발 단계 간의 균형적인 지원과 응용 연구 확대가 요구되며, 마지막으로 지역 간 연구개발 활 동의 불균형 해소를 위한 정책적 대응이 필요할 것으로 예상된다. 이러한 시사점은 스마트팩토리 분야의 향후 R&D 정책 수립 및 개선에 중요한 기초자료로 활용될 수 있을 것으로 기대된다.
마지막으로, 본 연구는 스마트팩토리 R&D 프로젝트를 분석하는 데 몇 가지 한계를 가진다. 첫째, 본 연구는 2000년부터 2022년까지 총 23년간의 데이터를 사용하여 종단면 분석(longitudinal analysis)을 수행했기 때문에, 최근 시점의 기술 변화나 추세를 충분히 반영하지 못한 한계가 있다. 둘째, 스마트팩토리 기술은 다양한 산업에 걸쳐 있기 때문에, 세부 산업별 차이를 더 깊이 분석할 필요가 있다. LDA 분석을 통해 도출된 기술 주제는 일부 세부 분야에 대한 심층 분석이 부족할 수 있다. 마지막으로, R&D 성과에 영향을 미치는 외부 요인(정책적 변화, 경제적 환경 등)에 대한 분석이 제한적이다.
따라서 향후 연구에서는 이러한 한계를 보완하고, 다양한 시점의 데이터를 추가적으로 수집하여 시간에 따른 트렌드 분석을 수행하는 것이 필요하다. 또한, 스마트팩토리 기술이 산업별로 어떻게 발전하고 있는지에 대한 심층적인 연구가 필요하며, 정책적 요인과 경제적 변화 가 연구 성과에 미치는 영향을 종합적으로 분석해야 할 것이다. 글로벌 기술 동향과의 비교를 통해 한국의 스마트팩토리 기술이 국제적으로 어떤 위치에 있는지 평가하는 연구도 중요한 과제가 될 것이다.