인공지능의 발전은 모든 산업을 빠르게 변화시키고 있습니다. 그중에서도 금융 분야는 AI 기술이 빠르게 확산되고 있는 대표적인 산업군 중 하나입니다. 이러한 빠른 발전에 발맞춰서 KRX는 금융 특화 언어 모델의 개발과 성능 향상을 촉진하고, 이를 통해 더욱 정확하고 효율적인 금융 정보 분석 및 예측 서비스를 제공하고자 KRX 금융 언어 모델 경진대회를 개최하였습니다.
해당 대회에서 참가자들이 제출한 금융 특화 언어 모델을 평가하기 위해 KRX와 OnelineAI가 공동 개발한 'KRX-Bench'를 이용하였습니다. 참가자들은 각자의 방법론을 활용하여 모델을 학습시키고 제출하면, KRX-Bench로 제출 모델의 금융 능력을 평가하여 리더보드를 구축하는 방식으로 대회가 진행되었습니다.
약 2개월간 진행된 경진대회에서 쌓인 다양한 데이터와 경험을 바탕으로, 금융 언어 모델 개발의 생생한 노하우가 담긴 Technical Review와 이 노하우를 기반으로 탄생한 한국어 금융 특화 언어 모델 ₩ON을 자세히 소개합니다.
<aside> <img src="notion://custom_emoji/0bb1cad1-d561-4cab-81f6-feb646f3526d/1c682c53-f159-8049-a8a0-007a53013dd9" alt="notion://custom_emoji/0bb1cad1-d561-4cab-81f6-feb646f3526d/1c682c53-f159-8049-a8a0-007a53013dd9" width="40px" />
</aside>
본 경진대회는 한국 금융 분야에서 최초로 시도된 공개적인 LLM 평가 리더보드 구축 및 모델 평가 경진대회입니다. 약 2개월간 진행된 이번 대회는 233개의 팀이 참가 등록을 완료하였으며, 총 1,119개의 모델이 제출되는 등 놀라운 성과를 기록하며 마무리되었습니다. 또한 참가팀의 절반 이상인 52.5%가 기업 참가자였으며, 그 외에는 모두 학계 관계자인 것으로 보아 금융 LLM 분야가 다양한 도메인으로부터 관심을 받고 있다는 것을 보여주었습니다. 여기에 추가적으로 현재까지도 약 600개 이상의 모델이 HuggingFace를 통해 공개적으로 활용 가능하며, 한국 금융 NLP 연구를 위한 소중한 자산으로 남아있습니다.
경진대회는 예선과 본선, 총 2가지 단계로 나눠서 진행되었으며 각 단계에서는 다음과 같이 서로 다른 방향성으로 진행하였습니다:
경진대회에 사용된 벤치마크는 다음과 같이 6가지 서브셋에서 총 5,500개 이상의 평가 항목으로 구성되었습니다. 이때 각 서브셋에 대한 자세한 설명은 다음과 같습니다: