Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.47 No.4 pp.76-86
DOI : https://doi.org/10.11627/jksie.2024.47.4.076

Analyzing the Impact of ESG on Corporate Financial Performance Using Machine Learning

Jae-Young Lee**, Woo-Chang Cha*
*Department of Industrial Engineering, Kumoh National Institute of Technology
**Office of Quality Assurance, Samsung Display
Corresponding Author : chaw@kumoh.ac.kr
02/10/2024 31/10/2024 26/11/2024

Abstract


This study analyzes the impact of ESG (Environmental, Social, and Governance) activities on Corporate Financial Performance(CFP) using machine learning techniques. To address the linear limitations of traditional multiple regression analysis, the study employs AutoML (Automated Machine Learning) to capture the nonlinear relationships between ESG activities and CFP. The dataset consists of 635 companies listed on KOSPI and KOSDAQ from 2013 to 2021, with Tobin's Q used as the dependent variable representing CFP.



The results show that machine learning models outperformed traditional regression models in predicting firm value. In particular, the Extreme Gradient Boosting (XGBoost) model exhibited the best predictive performance. Among ESG activities, the Social (S) indicator had a positive effect on CFP, suggesting that corporate social responsibility enhances corporate reputation and trust, leading to long-term positive outcomes. In contrast, the Environmental (E) and Governance (G) indicators had negative effects in the short term, likely due to factors such as the initial costs associated with environmental investments or governance improvements. Using the SHAP (Shapley Additive exPlanations) technique to evaluate the importance of each variable, it was found that Return on Assets (ROA), firm size (SIZE), and foreign ownership (FOR) were key factors influencing CFP. ROA and foreign ownership had positive effects on firm value, while major shareholder ownership (MASR) showed a negative impact.



This study differentiates itself from previous research by analyzing the nonlinear effects of ESG activities on CFP and presents a more accurate and interpretable prediction model by incorporating machine learning and XAI (Explainable AI) techniques.



머신러닝 모델을 활용한 ESG 활동과 기업 가치 분석

이재영**, 차우창*
*금오공과대학교 산업공학과
**삼성디스플레이 품질보증실

초록


    1. 서 론

    현대 기업 경영은 단순한 이윤 추구를 넘어서 사회적 책임(Corporate Social Responsibility, CSR)을 강조하는 방 향으로 변화하고 있다. 특히 2006년 UN 전 사무총장 코피 아난이 발표한 “UN 책임투자원칙(UN PRI)”을 통해 환경, 사회, 지배구조(Environmental, Social, and Governance, ESG)의 중요성이 부각되었다. 2020년, 세계 최대 자산 운용사 블랙록(BlackRock)이 지속 가능한 투자 원칙을 강조 하며, ESG 공시 부실 기업에 대해 투자 재고 및 이사 선임 반대를 선언한 이후, ESG 경영은 선택의 문제가 아니라 기업 생존을 위한 필수적 전략으로 자리 잡고 있다.

    Freeman[5]은 CSR이 기업의 장기적 가치를 높이는 중요한 요소로 작용하며, 고객 충성도와 이해관계자 간의 갈등을 완화하여 기업 이미지 개선에도 기여한다 주장하였다.

    그러나, Min and Kim[21]은 CSR 활동이 단기적으로 비용 부담을 가중하고, 경영 환경이 열악한 기업의 경우 큰 부담이 될 수 있다고 하며, 장기적으로 재무성과로 이어지지 않으면 투자를 지속하기 어렵다고 주장하였다.

    CSR과 ESG 활동이 기업 가치(Corporate Financial Performance, CFP)에 미치는 영향에 대해서는 부정론, 긍정론, 무효과론의 세 가지 시각으로 나누어지며, 최근 연구들은 장기적으로 긍정적인 영향을 제시하고 있다. 그러나, 기존 선행 연구들은 CSR, ESG와 CFP 간의 선형적 관계를 가정한 다중 회귀 분석으로 대부분 진행되어, 비선형적 상호작용을 포착하는 데 한계를 보였다.

    ESG는 표준화된 지표로 기업의 환경(E), 사회(S), 지배 구조(G) 성과를 평가하며, 투자자의 관점에서 중요한 역할을 한다. 본 연구는 한국 ESG기준원(Korea Institute of Corporate and Sustainability, KCGS)의 ESG 평가 결과를 바탕으로 (1) ESG 활동이 CFP에 미치는 비선형적 관계를 가장 잘 설명하는 머신러닝 모델을 선정하여, (2) 머신러닝 모델과 기존 회귀분석 모델 중 어떤 것이 예측 성능이 우수한지 비교하고, (3) ESG 활동이 CFP에 미치는 복합적이고 비선형적인 영향을 분석하는 것을 목표로 한다. 연구 도구로 AutoML(Automated Machine Learning) 기법을 사용하여 가장 적합한 모델을 자동으로 선정하여 연구자의 모델 선택 편향을 최소화하도록 하고, XAI(Explainable AI) 기법을 사용하여 변수 간의 상호 작용을 해석하여 머신러닝 모델의 신뢰성을 높이고 ESG와 CFP 간의 관계를 투명하게 해석하고자 하였다.

    2. 선행 연구

    2.1 기업의 사회적 책임과 기업 가치

    CSR, ESG활동과 CFP의 관계에 관한 연구는 크게 긍정론, 부정론, 무효과론으로 나눌 수 있다.

    첫째, 긍정론으로 Jones(1995), Hart(1995)는 CSR 활동이 기업 이미지 개선, 이해관계자와의 관계 강화를 통해 기업의 경쟁 우위를 확보하고, 장기적으로 재무성과를 향 상한다고 주장하였다[8,10]. 국내 연구에서도 Leem[17]은 KCGS 평가결과로, Lee and Park[16]은 경제정의연구소(KEJI) 지수로 ESG 활동이 CFP와 긍정적인 상관관계가 있다는 연구 결과가 발표하였다.

    둘째, 부정론으로 Friedman[6]은 CSR 활동이 기업의 비용을 증가시켜 주주 가치를 훼손한다고 주장하였다. Moore[22]는 영국 기업들을 대상으로 한 연구에서 CSR 활동과 재무성과 간의 부정적인 상관관계를 발견했으며, 국내 연구에서도 Min and Kim[21]과 Shin et al.[28]은 재무 상태가 좋지 않은 기업의 경우 CSR 활동이 단기적으로 부정적인 영향을 미칠 수 있다고 연구하였다.

    셋째, 무효과론으로 Fombrun and Shanley[4]는 CSR 성과 측정의 어려움과 기업의 특성 및 산업 환경에 따른 차이로 인해 CSR 활동과 재무성과 간의 관계를 명확하게 규명하기 어렵다고 주장하였다. Nelling and Webb[24]의 연구는 이러한 주장을 뒷받침하며, CSR 활동과 재무성과 간의 관계가 통계적으로 유의하지 않다는 결과를 제시하였다.

    기존 연구의 한계로는 대부분 변수 간의 관계가 선형성을 가정한 다중 회귀 분석에 의존하여 비선형적인 관계를 충분히 포착하지 못하였다. 본 연구에서 비선형 모델을 기 반으로 하는 머신러닝 기법을 사용하면 CFP에 대한 설명력을 높여 보다 정교한 분석이 가능할 것이다.

    2.2 머신러닝 기반 기업 가치 예측

    머신러닝 기술은 여러 분야에서 예측 모델의 정확도를 높이고, 더욱 정교한 의사 결정을 지원하는 데 기여하고 있다. 특히, 주가 예측, 기업 가치 평가 등 다양한 분야에서 활발하게 활용되고 있다. 기존에는 SVM, Decision Tree, Random Forest 등의 전통적인 머신러닝 알고리즘이 주로 사용되었지만, 최근에는 Neural Network, LSTM 등 딥러닝 모델까지 적용 범위가 확대되고 있다. Kuzey et al.[14] 은 SVM과 Decision Tree를 이용하여 미국 기업의 CFP를 예측했으며, Chuqing et al.[2]은 에너지 기업의 인수·합병 가격 예측에 여러 머신러닝 모델을 적용하는 연구를 진행 되었다[12].

    ESG 투자의 중요성이 주목받으면서, 머신러닝을 통해 ESG 정보를 분석하고 CFP와의 관계를 규명하려는 연구도 진행되고 있다. De Lucia et al.[3]은 유럽 공기업을 대상으로 ESG 활동이 재무성과에 미치는 영향을 분석하여, 특정 ESG 활동이 재무성과에 긍정적 또는 부정적인 영향을 미친다는 것을 밝혔다. Chen and Liu[1]은 ESG 정보를 활용한 주가 예측 모델을 개발하여, ESG 활동이 주가에 기여한다는 사실을 실증적으로 보여주었다.

    국내에서는 주가 예측, 중소기업 부도 예측 등 다양한 분야에서 머신러닝 기법을 활용한 연구가 진행되고 있습니다. Kang et al.[12]은 2011년부터 2021년까지 재무 정보와 KCGS의 ESG 등급을 활용하여 Tobin’s Q를 예측하는 5가지 머신러닝 모델을 비교 분석하였다. Heo and Yong[9]은 SVM을 활용하여 삼성전자 주가를 예측했으며, Lee et al.[15]은 기업 특성 변수와 온라인 리뷰 데이터를 바탕으로 다양한 머신러닝 기법을 사용하여 Tobin's Q를 예측하는 연구를 진행하였다.

    기존 CFP 관련 머신러닝 연구는 다양한 알고리즘을 활용하여 모델을 구축하고 성능을 비교해왔지만, 무수히 많은 머신러닝 모델 중 일부만을 고려하여 연구를 진행했기 때문에, 연구 결과의 객관성이 부족하였다. 이러한 문제를 해결하기 위해 등장한 AutoML은 데이터 전처리부터 모델 선택, 하이퍼파라미터 튜닝, 평가까지 머신러닝 과정 전체를 자동화하여 다양한 모델을 효율적으로 비교하고 최적의 모델을 찾도록 지원한다. 특히, PyCaret과 AutoKeras와 같은 프레임워크를 활용하면 몇 줄의 코드 만으로도 복잡한 머신러닝 작업을 수행할 수 있어 연구 효율성을 크게 높일 수 있다. PyCaret은 다양한 머신러닝 작업을 지원하며, AutoKeras는 딥러닝 모델 개발에 특화되어 있다[7].

    2.3 Explainable AI

    머신러닝 모델은 복잡한 패턴을 학습하여 높은 예측 성능을 보여주지만, 그 내부 작동 원리를 이해하기 어려운 블랙박스 문제를 가지고 있다. 특히, 중요한 의사 결정에 머신러닝 모델을 활용할 때는 모델의 예측 결과에 대한 신뢰성과 투명성 확보가 필수적이다[29]. 이러한 문제를 해결하기 위해, 설명 가능한 인공지능(XAI) 연구가 활발하게 진행되고 있으며, SHAP(SHapley Additive ex- Planations)은 대표적인 XAI 기법의 하나다. SHAP는 게임 이론의 샤플리 값을 기반으로 개발된 방법으로, 머신러닝 모델의 예측 결과에 각 변수가 이바지한 정도를 시각적으로 설명할 수 있다[27]. Lundberg and Lee[18]는 SHAP을 제안하며 머신러닝 모델의 예측 결과를 해석하는 새로운 가능성을 제시하였다. Ryu et al.[26]은 Yelp.com 데이터를 활용하여 SHAP와 LIME을 비교 분석하고, 온라인 리뷰 데이터에서 유용한 리뷰를 추천하고 해당 리뷰의 유용성을 설명하는 연구를 수행하였다. 또한, Ylinen and Ranta[30]은 조직 문화와 CFP의 관계를 분석하는 연구에서 SHAP 분석을 통해 변수의 중요도를 평가하고, 모델의 예측 결과를 심층적으로 해석하였다. 본 연구에서도 기존 연구에서 제시된 SHAP의 강점을 바탕으로, ESG 활동과 CFP에 대한 더욱 정확하고 신뢰할 수 있는 분석 결과를 도출하고자 한다.

    2.4 연구 가설 설정

    본 연구는 선행 연구 결과를 바탕으로, AutoML 기법을 활용하여 다양한 머신러닝 모델을 비교하고, 최적의 모델을 선정하여 기존의 다중 회귀 분석 모델보다 향상된 CFP 예측 성능을 확보하고자 한다.

    • 가설 1: AutoML 선정한 머신러닝 모델이 다중 회귀 분석보다 CFP 예측 성능이 우수할 것이다.

    ESG 관련 변수를 포함한 모델과 포함하지 않은 모델의 예측 성능을 비교하는 Ablation Study(절제 연구)를 통해 ESG 요소가 CFP에 미치는 영향을 정량적으로 평가하고자 한다[20].

    • 가설 2: ESG 활동은 CFP에 영향을 줄 것이다.

    SHAP 분석을 사용해 ESG 요소의 독립적인 기여도를 측정하고, ESG 요소 간의 상호작용 효과를 고려한 영향을 확인하고자 한다.

    • 가설 2-1: ESG 종합(ESG)은 CFP에 긍정적 영향을 줄 것이다.

    • 가설 2-2: 환경(E)요소는 CFP에 긍정적 영향을 줄 것이다.

    • 가설 2-3: 사회(S)요소는 CFP에 긍정적 영향을 줄 것이다.

    • 가설 2-4: 지배구조(G) 요소는 CFP에 긍정적 영향을 줄 것이다.

    3. 연구 방법

    3.1 연구 모형 설계

    CFP를 나타내는 변수로는 Tobin’s Q를 사용하였다. Tobin’s Q는 기업의 시장가치와 실물 자본 대체원가의 비율을 의미하며, 여기서 시장가치는 연평균 시가총액과 총 부채를 통해 계산하고, 대체원가는 총자산을 사용하였다. ESG 활동이 CFP에 미치는 시차를 고려하여 n+1년도의 Tobin’s Q를 사용하였다[16, 17].

    [모형 A]

    T Q n + 1 = f ( R O A , A D V , S G R W , L E V , R D , S I Z E , M A S R , F O R , E S G , E , S , G , Y E A R , I C ) n

    • - TQn+1 는 n+1년에 대한 Tobin's Q 값을 의미한다.

    • - f( )는 독립 변수들의 함수 관계를 나타낸다.

    Morck et al.[23], McConnell et al.[19]는 부채 비율(LEV), 연구 개발비율(RD), 매출액 성장률(SGRW), 기업 규모(SIZE)가 유의한 영향을 미치는 것으로 밝혔다. Kang and Ko[11]은 ROA(Return on Assets)와 외국인 지분율(FOR), 대주주 지분율(MASR)이 유의한 영향을 미치는 것으로 확인하였다.

    ESG 평가 관련하여, 한국ESG기준원(KCGS), 경제정의 실연구소(KEJI) 등 여러 민간기관에서 각자의 평가 모델로 국내 기업의 ESG 등급을 측정하고 있으며, 그 중 KEJI와 KCGS 등급이 빈번하게 사용된다[13]. 본 연구에서는 KCGS의 데이터를 사용하였다. KCGS는 ESG 전체(ESG), 환경(E), 사회(S), 지배구조(G) 활동을 S부터 D 등급까지 7단계로 평가한다. Park and Shin(2021)는 KCGS의 평가등급이 국제적으로 입증된 Morgan Stanley Capital International(MSCI) ESG 평가 지수와 상관분석 결과, 상관계수 0.46(p-value 0.001)으로 통계적으로 유의한 관계를 보여 평가 기준의 타당성을 확인하였다[25].

    <Table 1>은 본 연구에서 사용된 변수들을 정의한 것이다.

    3.2 데이터 수집

    본 연구는 2013년부터 2021년까지 KOSPI 및 KOSDAQ 상장사 635개사의 재무 정보, 소유 구조, ESG 등급 데이터를 분석하였다. 재무 데이터는 NICE신용평가의 KIS_VALUE 를 기반으로 구성하였으며, 소유 구조 데이터는 금융감독원 전자공시시스템의 OPEN API를 통해 수집하였다. ESG 등급은 KCGS의 데이터를 제공받아 활용하였다. 분석 대상 기업은 회계 기준 및 ESG 등급 정보가 완전한 비 금융 기업으로 한정하였으며, 시차 효과를 고려하여 2021년 데이터는 종속 변수인 Tobin’s Q에만 사용하였다.

    3.3 데이터 전처리

    수집된 데이터는 머신러닝 모델 학습에 적합하도록 다음과 같이 전처리하였다. 수집 데이터 중 결측치는 해당 기업의 평균값으로 대체하고, 수치형 변수는 StandardScaler를 이용하여 정규화(평균 0, 표준편차 1)했으며, ESG 등급은 7점 척도로 변환하여 서열형 변수로 처리하였다. 또한, 산업 분류와 연도는 범주형 변수로 One-Hot 인코딩을 사용하여 모든 범주를 독립적인 변수로 변환하여, 머신러닝 모델이 정보를 학습할 수 있도록 하였다

    3.4 성능 지표

    모델의 예측 성능을 다각도로 평가하기 위해 MAE (Mean Absolute Error), MSE(Mean Squared Error), RMSE (Root Mean Squared Error), R²(결정 계수)를 사용하였다.

    3.4.1 MAE(Mean Absolute Error)

    MAE는 실제 값과 예측값 사이의 차이를 절댓값으로 계산하고, 그 차이들의 평균이다. 이상치에 덜 민감한 지표이다.

    3.4.2 MSE(Mean Squared Error)

    실제 값과 예측값 사이의 차이를 제곱하여 측정하고, 그 제곱 오차들의 평균을 계산하는데, 이상치에 민감한 지표로, 오차의 크기에 대한 페널티를 더 많이 주고자 할 때 적용한다.

    3.4.3 RMSE(Root Mean Squared Error)

    MSE의 제곱근으로 원래의 단위로 환산한 지표로 직관적으로 이해하기 쉽다.

    3.4.4 R² (결정 계수)

    R²은 모델 종속 변수의 총 변동 중 얼마나 많은 비율을 설명할 수 있는지를 나타내는 값이다. 실제 값과 모델이 예측한 값 사이의 총 제곱 오차(SSR: Sum of Squares Regression)와 실제 값과 종속 변수의 평균 사이의 총 제곱 오차(SST: Total Sum of Squares)를 사용하여 계산한다. 모델의 SSR이 크면 (-)값이 나올 수 있다.

    R 2 = 1 ( S S R / S S T )

    3.5 분석 절차

    본 연구에서는 파이썬 기반 AutoML 도구인 PyCaret 3.2 버전의 회귀분석 모듈을 활용하였다. PyCaret은 데이터 전 처리부터 모델 학습, 하이퍼파라미터 튜닝, 평가, 시각화까지 머신러닝 프로세스 전반을 자동화하여 효율적인 분석을 가능하게 하므로, 본 연구에서 채택되었다[7].

    구체적인 분석 과정은 다음과 같다. 먼저, 전체 데이터의 70%를 학습 데이터로, 나머지 30%를 테스트 데이터로 분할하였다. 전처리된 학습 데이터를 PyCaret에 내장된 19개의 다양한 회귀 모델을 학습시키고, 20회 교차 검증을 통해 각 모델의 하이퍼파라미터를 자동으로 최적화하였다. 최종적으로 MAE, MSE, RMSE, R² 교차 성능 평균값으로 가장 우수한 모델을 선정하였다.

    선정된 최적 모델에 대해 사전에 분리해둔 테스트 데이터를 이용하여 일반화 성능을 검증하고, 각 변수의 중요도를 SHAP 분석하여 모델의 예측에 가장 큰 영향을 미치는 요인을 파악하였다.

    4. 연구 결과

    4.1 기초 통계 분석

    본 연구에 사용된 변수들의 기술 통계량 값을 <Table 2>는 보여준다.

    TQ(Tobin's Q) 평균은 1.2로 ESG 평가 대상 기업들이 자산 대비 적절한 시장 가치를 유지하고 있음을 알 수 있다. ROA(Return on Assets) 평균은 0.15로 연구 대상 기업들이 자산을 효율적으로 활용하여 수익을 창출하고 있음을 보여준다. 그러나 최솟값 -0.26으로, 일부 기업이 손실을 기록했지만, 최댓값은 2.04로 높은 수익성을 보이는 기업도 있음을 확인할 수 있다. 대주주의 지분율(MASR)은 평균 44.08%로 대주주가 상당한 지분을 보유하고 있는 기업들이 다수를 차지하고 있음을 시사한다. 매출 성장률(SGRW)은 평균 11.37이나 표준편차가 397.66으로 매우 커, 기업 간 매출 성장률의 변동성이 큼을 보여준다.

    외국인 지분율(FOR)은 평균 10.03%이며, 최댓값은 89.30% 로 외국인이 지배적인 지분을 보유한 기업도 확인된다.

    환경(E) 지표는 평균 2.70, 사회(S) 지표는 평균 2.97, 지배구조(G) 지표는 평균 2.94로 B 등급 중심으로 분포하는 것을 알 수 있다.

    모형 A와 ESG의 환경(E) 사회(S), 지배구조(G), ESG 종합 평가(ESG) 요소에 대한 다중 회귀 분석 결과는 <Table 3>과 같다. 모형 A 분석 결과, ROA 및 외국인 지분율 (FOR)은 CFP에 긍정적인 영향을 미치지만, 대주주 지분율(MASR)과 기업규모(SIZE)는 부정적인 영향을 미치는 것으로 나타났다. 모형 A의 ESG 종합 점수가 E, S, G 평가를 취합한 값으로 공선성을 피하고자, 항목별로 회귀 모델로 검정하면, 환경(E)과 사회(S), 그리고 ESG 종합 평가는 CFP에 긍정적인 영향을 미치는 것을 보여준다.

    4.2 머신러닝 모델 선정

    Pycaret의 RegressionExperiment 모듈을 활용하여 회귀 분석을 수행하였다. Setup함수로 전처리된 데이터를 PyCaret의 Compare 메서드를 통해 19개의 회귀 모델의 교차 검증 평균 성능을 자동으로 비교하였다.

    <Table 4>는 모형 A 학습 세트 성능 지표 상위 10개 모델이다. Extra Trees, Random Forest, XGBoost, LightGBM이 성능이 우수한 것으로 보여준다. 우수 머신러닝 모델은 모두 결정 트리(Decision Tree)를 기반으로 여러 개의 약한 학습자를 결합하여 성능을 향상하는 Boosting과 앙상블 학습 방법을 사용한다는 공통점을 갖는다.

    4.3 일반화 성능 검증

    학습된 머신러닝 10개 모델을 학습 시 사용하지 않은 1,417개의 테스트 세트로 Predict 메서드로 머신러닝 모델의 일반화 성능 및 과적합 여부를 평가하였다.

    모형 A의 테스트 세트 일반화 평가 결과 <Table 5>는 XGBoost, Extra Trees, Random Forest, LightGBM 순으로 성능이 우수하였다. 이는 학습 단계 Extra Trees가 가장 좋은 성능을 보여준 것과 다르게 나타났다. 학습 모델 교차 성능 평균값 <Table 4>와 일반화 성능 검증 결과 <Table 5> 비교 시 유사한 수준으로, 학습된 머신러닝 모델들이 과적합 되지 않았음을 확인할 수 있다.

    모형 A의 기존 연구 방법인 다중 회귀와 머신러닝 XGBoost모델의 성능 지표를 비교한 <Table 6>은 모든 부 분에서 XGBoost모델의 성능 지표가 우수하고, 모형 변동 의 설명력(R²)은 138%나 향상됨을 볼 수 있어, “가설 1 : AutoML 선정한 머신러닝 모델이 다중 회귀 분석보다 CFP 예측 성능이 우수할 것이다.”를 채택할 수 있다.

    모형 A에서 E, S, G 및 ESG 종합 변수를 제외하는 Ablation Studies 방법으로 모형 B를 수립하고 ESG 활동의 CFP 영향을 평가하였다[25]. 모형 A와 모형 B의 XGBoost 성능을 비교한 결과 <Table 7>은 ESG 활동이 포함된 모형 A의 성능 지표 MAE 0.07, MSE 0.046, RMSE 0.031, R²이 0.04만큼 모든 지표가 우수하여, “가설 2: ESG 활동은 CFP에 영향을 줄 것이다.”를 채택할 수 있다.

    XGBoost의 모형 A의 예측 성능을 평가해 보면, MAE 0.37와 RMSE 0.73은 TQ 평균 1.20, 표준편차 0.99인 것과 비교 시 비교적 작은 편이다. 특히 TQ의 최댓값 15.29을 고려할 때 MAE와 RMSE가 데이터의 대부분의 값을 잘 예측하고 있다는 것을 보여준다. R² 54.3%는 변동에 대해 절반은 설명할 수 있는 수준으로 기존 다중회귀 분석에 비해 많이 개선되었지만 개선할 여지가 있음을 보여준다.

    4.4 기업 가치 영향 변수

    본 절은 XGBoost 학습된 모형 A를 SHAP 기법을 적용하여 특성 중요도를 평가하였다. 중요도 평가 시 One-Hot Encoding된 산업 분류 및 연도 특성은 분석에서 제외하였다.

    SHAP Mean Plot <Figure 1>은 CFP에 미치는 각 변수의 Shapley 평균값을 나타낸다. ROA, MASR, SIZE, FOR 순으로 CFP에 대한 영향력이 크게 나타났으며, 특히 ROA는 CFP를 높이는 데 긍정적인 영향을 미치는 것으로 확인되었다. 반면, ESG 항목은 상대적으로 낮은 중요도를 보였다. 이는 ESG 7단계 등급 변수를 순서 척도로만 반영하며, 평균 2.9, 표준편차 0.9~1.2의 값으로 세밀한 관계는 반영되지 않기 때문에 발생했을 가능성이 높다.

    SHAP Mean Plot 영향의 크기만 알 수 있고, SHAP Summary Plot에서는 영향의 방향도 확인할 수 있다.

    SHAP Summary Plot <Figure 2>는 변수의 높고 낮은 값이 CFP에 어떻게 영향을 미치는지 보여준다. Y축 오른쪽 색상은 변수의 값 크기로 빨간색은 높은 값, 파란색은 낮은 값을 의미한다.

    환경(E) 요소와 ESG 종합(ESG) 요소는 파란색이 오른쪽에 있어 부(-)의 영향을 보여주며, 사회(S) 요소는 붉은색이 오른쪽에 있어 정(+)의 효과가 있음을 보여준다. 지배구조 (G)는 주변에서 큰 값과 낮은 값이 혼재된 패턴을 보여 많은 상관관계가 존재함을 보여주며 판단하기 어렵다.

    특히 <Figure 2>의 SHAP 값 0이 왼쪽으로 치우쳐 있는 것은 변수들이 일정 임곗값을 넘어가면 종속 변수에 큰 긍정적인 영향을 주지만, 그 이하의 값에서는 부정적인 영향을 덜 미친다는 것을 의미한다. 비대칭인 ESG, E, S요소 는 비선형 관계가 있음을 보여준다.

    CFP에 영향을 미치는 ROA는 붉은색이 오른쪽에 있으므로 ROA가 높을수록 CFP가 높아지는 정(+) 효과가 있고, 대주주 지분(MASR), 기업규모(SIZE)는 파란색이 오른쪽에 있으므로 적을수록 CFP가 높아지는 부(-)의 효과가 있음을 보여준다. 매출 성장률(SGRW), 외국인 지분 (FOR), 연구개발비(RD)는 정(+)의 효과가 있다.

    또한 SHAP 0값 한쪽으로 기울어진 ROA, MASR, SIZE, RD도 비선형적인 관계임을 보여준다.

    SHAP Interaction plot <Figure 3>은 두 변수 간 상호작용이 종속 변수에 미치는 영향을 나타낸 것이다. x축과 y 축의 같은 변수는 주효과를, 다른 변수는 교호작용을 나타낸다. 특정 변수들이 함께 있을 때 SHAP 값이 크게 변화 한다면, 이는 그 변수간 상호작용이 종속 변수에 큰 영향을 준다는 의미이며, 붉은색은 상호작용 값이 큰 경우를, 파란색은 작은 값을 의미한다.

    <Figure 3>에 따르면 E 요소의 주 효과는 정(+)의 영향이나, ROA, SIZE, MASR의 교호작용은 부(-)의 영향을 보여준다.

    G 요소의 주 효과는 정(+)의 영향이나, FOR, MASR의 교호작용은 부(-)의 영향을 보여준다.

    S 요소의 주 효과는 정(+)의 효과이며, ROA, SIZE, MASR의 교호작용도 정(+)의 효과를 보여준다.

    ESG 종합 요소는 주 효과는 부(-)의 영향이 있음을 알 수 있다.

    ROA의 주 효과는 CFP에 긍정적인 영향이 있으며, SIZE와 교호작용은 파란 점이 오른쪽에 몰려 있어 값이 작을수록 CFP에 긍정적 효과를 나타낸다.

    SIZE의 주효과는 파란색 점들이 오른쪽에 집중되어 있고, 모형이 비대칭으로 작은 규모의 회사가 CFP에 긍정적인 영향을 미친다는 것 보여준다.

    대주주지분율 MASR의 주 효과는 낮은 값이 긍정적인 향을 보이나, 일부 구간에서는 큰 값도 긍정적인 영향을 보여준다. 이는 MASR이 CFP에 미치는 영향이 일정하지 않으며, 특정 구간에서 긍정적이거나 부정적인 영향을 미칠 수 있는 복잡한 관계가 있음을 시사한다. 이는 대주주의 경영 참여와 통제력의 최적 수준을 고려한 전략적 접근이 필요함을 의미한다.

    외국인 지분율 FOR의 주 효과는 정(+)의 효과가 있음을 보여준다.

    다중 회귀 분석 <Table 2>에서 E, S, ESG 종합 요소가 CFP에 정(+)의 영향 판단하였으나, 머신러닝 SHAP 분석 결과 E, ESG 요소는 부(-)의 영향으로, S 요소는 정(+) 영향 동일하게 나타났다. 이것은 머신러닝 모델이 변수 간의 비선형적 상호작용을 포착하였기 때문일 것이다.

    환경(E)와 ESG 종합(ESG)의 부정적인 이유는 초기 비용 증가와 같은 요인이 원인일 수 있으며, 사회(S) 활동은 이해관계자 신뢰를 높여, CFP에 기여하고 있음을 보여준 다. 지배구조(G)는 평가 구성 항목보다 대주주 지분과 외국인 지분 같은 소유 구조 항목이 더 크게 영향을 미치고 있음을 볼 수 있다.

    5. 결 론

    5.1 연구 결과 요약

    본 연구는 2013년부터 2021년까지 635개 상장 기업의 재무 데이터를 수집하여, 이를 바탕으로 CFP와 ESG 활동 간의 관계를 머신러닝으로 분석하였다. 연구 결과 머신러닝 기법이 CFP 예측에 있어 기존의 다중 회귀 분석보다 더 높은 성능을 발휘함을 실증적으로 확인하였다. 이는 비선형적 상호작용을 효과적으로 포착한 덕분이다.

    또한 ESG 종합, 환경(E)는 CFP에 기존 회귀분석과 다르게 부정적 영향을, 사회(S)는 회귀분석과 동일한 긍정적 영향을, 지배구조(G)는 상호작용이 복잡하게 혼재되어 있어 긍정적 영향이라 말하기 어렵다.

    본 연구에서 수립한 가설의 결과는 <Table 8>과 같다.

    5.2 시사점

    본 연구의 시사점은 다음과 같다.

    첫째, AutoML로 선정된 머신러닝 기법을 통해 ESG와 CFP 간의 비선형적 관계를 포착할 수 있음을 확인한다. 이는 기존 다중 회귀분석의 한계를 보완하며, CFP 예측에서 더 정확한 분석을 가능하게 하게 하였다. 앞으로 ESG 관련 연구에서 비선형적 분석 기법의 활용이 중요시되어야 할 것이다.

    둘째, XAI(Explainable AI) SHAP 기법을 활용해 머신러닝 모델의 투명성과 신뢰성을 높였으며, 이를 통해 ESG와 CFP 간의 관계를 더욱 명확하게 이해할 수 있도록 보여주었다. 이는 의사결정자들이 ESG 요소가 CFP에 미치는 영향을 더 신뢰할 수 있도록 하였고, 의사 결정을 지원하는 중요한 도구가 될 것이다.

    셋째, ESG 활동이 CFP에 미치는 영향을 분석한 결과, 환경(E) 변수는 부정적인 영향을 미칠 수 있음을, 사회(S) 변수는 긍정적인 영향을 미칠 수 있음을 확인하였다. 환경(E) 활동이 단기적으로는 비용 부담을 초래할 수 있다. 그러나 장기적으로는 이러한 투자들이 지속 가능한 성장으로 이어져 CFP에 긍정적인 영향을 미칠 수 있음을 인식하고 전략을 수립하거나 투자를 결정해야 할 것이다. 사회 (S) 활동의 긍정적인 영향은 기업의 지속 가능성을 증가시키는 중요한 요소로 작용할 수 있기에 지속적인 활동이 필요함을 보여준다. 지배구조(G) 항목은 복합적인 상호관계가 있으며, 대주주지분율, 외국인 지분율과 같은 소유 구조가 CFP에 더 큰 영향을 미치는 것을 확인하였다. 기업의 지배구조(G)가 개선되더라도 소유 구조가 제대로 조정되지 않으면 CFP에 긍정적인 효과를 내기 어려우며, 이러한 요소를 함께 개선할 필요가 있음을 보여주었다.

    5.3 연구의 한계 및 향후 계획

    본 연구의 한계점은 다음과 같이 정리할 수 있다.

    첫째, 샘플의 한계이다. 본 연구는 2013년부터 2021년까지의 KOSPI와 KOSDAQ 상장 기업 데이터를 사용하였으며, 한국 시장에 국한된 결과를 도출하였다. 따라서 다른 국가나 시장 상황에 일반화하는 데는 한계가 있다. 이를 극복하기 위해서는 국제적으로 통용되는 ESG 평가 지표나 다른 시장 데이터를 활용한 추가 연구가 필요하다.

    둘째, AutoML 한계이다. AutoML 기법은 모델 선택과 하이퍼파라미터 튜닝을 자동으로 수행하여 빠르게 분석을 진행할 수 있다는 장점이 있지만, 세부적인 파라미터 조정이 제한되며, 연구자가 데이터를 기반으로 한 도메인 지식을 추가 반영하기 어렵다는 한계가 있다. 이는 머신러닝 모델의 해석 가능성을 제한할 수 있으며, 세밀한 파라미터 조정을 요구할 때는 전용 모듈로 재학습하고 다시 분석할 필요가 있다.

    셋째, SHAP 해석의 한계이다. SHAP 기법을 사용하여 ESG 활동이 CFP에 미치는 영향을 설명하려 하였으나, 대주주지분율(MASR), 지배구조(G) 변수 간의 상호작용을 완벽하게 설명하지 못하였다. 이는 SHAP 기법이 상관관계를 기반으로 하여 인과관계를 명확히 도출하는 데 한계가 있기 때문인데, 이를 극복하기 위해 Causal Forest, Double Machine Learning, Structural Causal Model 등과 같은 인과 머신러닝 기법을 도입하여 복잡한 변수 간의 인과 관계 연구가 추가 필요하다.

    넷째, ESG 평가 지표의 한계이다. ESG 활동은 다른 재무 변수들과 상호작용이 상대적으로 적게 나타났는데, 이는 ESG 등급 변수를 순서 척도로만 반영하여 발생한 결과 일 가능성이 크다. 이러한 문제를 해결하기 위해 ESG 등급을 점수로 제공하는 지표를 사용하거나, 더욱 정교하게 반영하는 방법론이 필요하다.

    본 연구를 통해 경영 및 재무 분야에서도 머신러닝을 활용한 실증 연구가 확대되며, 실무 현장에서도 넓게 사용되기를 기대한다.

    Acknowledged

    This research was supported by Kumoh National Institute of Technology (2024).

    Figure

    JKSIE-47-4-76_F1.gif

    Average Feature Effects using SHAP

    JKSIE-47-4-76_F2.gif

    SHAP Summary Plot

    JKSIE-47-4-76_F3.gif

    Feature Intersection SHAP Value Plot

    Table

    Definition of Variables in the Research Model

    Descriptive Statistics Analysis

    Model A Multi–Regression Result

    Signif. codes: *p<.10, **p<.05, ***p<.01

    Performance Metrics of the Trained Model A

    Performance Metrics of Model A on the Test Set

    Model A XGBoost Multiple Regression and Performance Metrics

    Model A Vs Model B Performance Metrics

    Hypothesis Result

    Reference

    1. Chen, Q. and Liu, X.Y., Quantifying ESG Alpha Using Scholar Big Data: An Automated Machine Learning Approach, Proceedings of the First ACM International Conference on AI in Finance (ICAIF '20), Association for Computing Machinery, New York, NY, USA, 2021, Article 41, pp. 1-8.
    2. Chuqing Z., Han., Dunnan L., A Contrastive Study of Machine Learning on Energy Firm Value Prediction, Journal IEEE, 2019, pp. 11635-11643,
    3. De Lucia, C., Pazienza, P., and Bartlett, M., Does Good ESG Lead to Better Financial Performances by Firms? Machine Learning and Logistic Regression Models of Public Enterprises in Europe, Sustainability, 2020, Vol. 12, No. 13, p. 5317.
    4. Fombrun, C. and Shanley, M., What’s in a Name? Reputation Building and Corporate Strategy, Academy of Management Journal, 1990, Vol. 33, No. 2, pp. 233-258.
    5. Freeman, R.E., Strategic Management: A Stakeholder Approach, second ed., Cambridge university press, 2010.
    6. Friedman, M., The Social Responsibility of Business Is to Increase Its Profits, New York Times Magazine, 1970, Vol. 32, No. 13, pp. 122-126.
    7. Gain, U. and Hotti, V., Low-Code AutoML-Augmented Data Pipeline - A Review and Experiments, Journal of Physics: Conference Series, 2021, Vol. 1828.
    8. Hart, S.L., A Natural Resource-Based View of the Firm, Academy of Management Review, 1995, Vol. 20, No. 4, pp. 986-1014.
    9. Heo, Y.J., Yong, J.Y., SVM based Stock Price Forecasting Using Financial Statements, KIISE Transactions on Computing Practices, 2015, Vol. 21, No. 3, pp. 167-172.
    10. Jones, T.M., Instrumental Stakeholder Theory: A Synthesis of Ethics and Economics, Academy of Management Review, 1995, Vol. 20, No. 2, pp. 404-437.
    11. Kang, J.Y., Ko, J.K., Tax Avoidance, Firm Value and Corporate Governance, Korea Accounting Review, 2014, Vol. 39, No. 1, pp. 147-183.
    12. Kang, K.G., Park, C.Y., Na, H. J., A Comparative Study of Machine Learning-Based Future Enterprise Value Prediction Models: Impact of ESG Evaluation Rating, Korean Journal of Business Administration, 2023, Vol. 36 No. 9, pp. 1515-1537.
    13. Kim, Y. and Park, J., ESG·CSR and Corporate Financial Performance: What Have We Learned, and Where Do We Go from Here? Journal of Strategic Management, 2021, Vol. 24, No. 2, pp. 75-114.
    14. Kuzey, C., Uyar, A., Delen, D., The impact of multinationality on firm value: A comparative analysis of machine learning techniques, Decision Support Systems, 2014, Vol. 59, pp. 127-142.
    15. Lee, H., Shin, D., Kim, H.E., Machine Learning based Firm Value Prediction Model: Using Online Firm Reviews, Journal of Internet Computing and Services, 2021, Vol. 22, No. 5, pp. 79-86,
    16. Lee, J. and Park, C., Do CSR Activities Improve Financial Performance? Focused on Job Satisfaction and Firm Size, Korean Management Review, 2020, Vol. 49, No. 4, pp. 913-937.
    17. Leem, W.B., Effect of Non-Financial Information on Firm Performance: Focusing on ESG Score, Korean International Accounting Review, 2019, Vol. 86, pp. 119-144.
    18. Lundberg, S.M. and Lee, S.I., A Unified Approach to Interpreting Model Predictions, Advances in Neural Information Processing Systems, 2017, pp. 4765-4774.
    19. McConnell, J.J. Servaes, H., Additional evidence on equity ownership and corporate value, Journal of Financial Economic, 1990, Vol. 27, No.2, pp. 595-612.
    20. Meyes, R., Melanie L., Constantin W.P., Tobias M., Ablation Studies in Artificial Neural Networks, 2019, arXiv preprint arXiv:1901.08644.
    21. Min, J.H. and Kim, B., Is ESG Effort a Normative Proposition for Sustainability? An Analysis of Different Effects of Firms’ ESG Efforts by Their Respective Financial Status, Korean Management Science Review, 2019, Vol. 36, No. 1, pp. 17-35
    22. Moore, G.M., Corporate Social and Financial Performance: An Investigation in the U.K. Supermarket Industry, Journal of Business Ethics, 2001, Vol. 34, No. 3, pp. 299-315.
    23. Morck R., Shleifer A., Vishny R.W., Management Ownership and Market Valuation, Journal of Financial Economics, 1988, Vol. 20, No. 1, pp. 293-315.
    24. Nelling, E. and Webb, E., Corporate Social Responsibility & Financial Performance: The ‘Virtuous Cycle’ Revisited, Review of Quantitative Finance and Accounting, 2008, Vol. 32, No. 2, pp. 197-209.
    25. Park, S. and Shin, E., Analysis of the Relationship between ESG Performance and Corporate Financial Values Focusing on SMEs, Journal of Environmental Policy and Administration, 2021, Vol. 29, No. 4, pp. 151-199.
    26. Ryu, D.Y., Xinzhe Li, Kim, J.Y., Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction, Korean Society of Intelligent Information Systems, 2023, Vol. 29, No.2, pp. 35-56.
    27. Shapley, L.S., A Value for N-Person Games, Contributions to the Theory of Games, Princeton University Press, 1953, Vol. 2, pp. 307-317.
    28. Shin, Y.Z., Nam, G., and Lee, J., The Relationship between Corporate Social Responsibility Activities and Stock Price Crash Risk in the Aspect of Agency Problem, Korean Accounting Journal, 2019, Vol. 28, No. 5, pp. 43-84.
    29. Sim, H.J., Choi, C.W., Kim, H.W., XAI Technology Trends for AI Reliability, Korean Information Processing Society Conference Proceedings, 2022, Vol. 29, No. 2, pp. 405-407.
    30. Ylinen, M. and Ranta, M., Employer ratings in social media and firm performance: Evidence from an explainable machine learning approach, Accounting & Finance, 2024, Vol. 64, pp. 247-276.