카테고리 없음

[2025 - 1] 김지원 - An Algorithmic Crystal Ball: Forecasts-based on MachineLearning

jw103203 2025. 5. 10. 10:54

논문 소개

 

논문 제목 : An Algorithmic Crystal Ball: Forecasts-based on MachineLearning

발간년도: 2018

저자 : Jin-Kyu Jung, Manasa Patnam, and Anna Ter-Martirosyan

특징 : IMF(Internationa Monetary Fnd) Working Paper


 

Research Question

매크로 데이터(다음 분기 GDP 성장률 등)을 예측할 때에도 딥러닝이 높은 정확도를 보여주는가?

 

Background

기존에 IMF나 World Bank와 같은 기관들이 각 국가의 전망에 대한 보고서들을 내면서 다음 분기 GDP 성장률을 예측한다.

하지만 Timmermann(2007)에 따르면 IMF의 World Economic Outlook(WEO) 예측은 체계적인 over-prediction을 보여주는 경향이 있다고 한다. 이어서 Genberg and Martinez(2014)에 따르면 WEO 예측은 지나치게 낙관적인 경우가 있다고 한다.

 

이러한 매크로 데이터 예측들은 각 변수들간의 특성(예를 들어 GDP와의 관련성)과 상호적인 관계가 중요하지만 딥러닝에서는 데이터 기반으로 그 관계들을 추출한다. 딥러닝은 경제 연구에서 소외되어 왔지만, Varian에 따르면 데이터의 증가 속도 그리고 복잡한 관계들을 볼 때 딥러닝의 활용이 필요하다고 주장했다. 따라서 저자는 딥러닝을 통해 기존 전문가들의 예측보다 더 뛰어난 정확도를 달성할 수 있는 지 실험해보고자 한다.

 

Model

저자는 3가지 모델을 선정했다 : Elastic Net, Recurrent Neural Network(RNN), Super Learner

Elastic Net은 아래 수식 3에서 볼 수 있듯, 일반적인 OLS 또는 회귀식에 L1, L2 정규화를 둘 다 추가한 것이다.

RNN의 경우 아래 이미지처럼 재귀적으로 작동하는 모델을 RNN이라고 한다.

마지막으로 Super Learner는 쉽게 말해 Ensemble이라고 생각하면 되는데 다양한 알고리즘을 따르는 모델들을 하나로 묶어 투표하게 하는 것이다.  이때 저자는 아래와 같은 모델들을 선택했다.

 

Experiments

저자는 G7에서 US, UK, Germany를 고르고 개발도상국에서 Mexico, Philippines, Vietnam을 골랐으며 추가로 Spain을 골랐다.

전체적인 데이터 분포는 아래와 같다.

 

이때 경제 데이터의 특성 상 분기별 데이터가 있고 연도별 데이터가 있는데 분기별 예측에는 분기별 변수들만 사용했고 연도별 예측에는 연도별 변수들만 사용했다는 점을 참고하면 된다.

 

결과는 아래 테이블에서도 볼 수 있듯이 딥러닝 모델이 압도적인 정확도를 보였다.

반면 연간 예측에서는 다른 모습을 보였는데 이는 Table 2. Data Overview에서도 볼 수 있듯, 연간 데이터의 양 자체가 50개 미만이기 때문으로 예측된다.

마지막으로 경제 위기(2007-2016)때로 국한하여 모델의 정확도를 분석해보면 그 차이가 더욱 압도적이다.

 

결론

전체적으로 볼 때 연도별 결과는 데이터가 더 쌓인 뒤 다시 판단해봐야할 문제인 것 같고 분기 별로 봤을 때는 기존 휴리스틱한 보고서나 통계적 방법들보다 더 뛰어난 성능을 보인다는 것을 확인할 수 있었다.