한 달 반 만에 작성한 논문이 국제 최우수 학회에 등재될 수 있을까요?

‘무슨 말도 안 되는 소리냐’ 하실 수 있겠지만, 놀랍게도 그 일이 실제로 일어났습니다! 🤭 PFCT AI R&D Team의 ML 엔지니어 지환님께서 제1저자로 작성하신 논문이 한국 금융사 최초로 ‘ICLR 2025 Workshop Advances in Financial AI’에 등재된 건데요.

ICLR(International Conference on Learning Representations)은 컴퓨터 및 관련 분야의 저명한 학회를 평가하는 코어 컨퍼런스 랭킹(CORE Conference Ranking)에서 최상위 등급인 A*를 받은 AI 및 ML 분야 글로벌 최고 학회입니다. 학계와 산업계 모두 주목하는 학회에 한 달 반 만에 작성한 논문이 등재되었다는 건 정말 놀라운 일이죠.

오랫동안 고민해오던 주제여서 가능했던 것 같아요. 2년 전쯤에도 같은 주제로 연구를 진행했었는데, 데이터가 충분치 않아 명확한 결과를 얻지 못했거든요. 그때 부족했던 부분과 개선 아이디어들을 메모로 남겨두었는데, 이번 논문을 준비하면서 그 기록들을 적극 활용했습니다. 덕분에 짧은 기간에도 논문을 완성할 수 있었죠.

‘금융 리스크 관리 영역에서 우리만큼 깊이 고민한 기술팀은 없다’고 자신하는 지환님의 이야기, 지금부터 들려드릴게요.

AI R&D Team, ML 엔지니어 김지환
– 한양대학교 컴퓨터공학 학사
– 카이스트 전산학부 석사
– 데이팅 앱 ‘오늘하루’ 개발
– 블록체인 커뮤니티 앱 ‘코박’ 개발

안녕하세요. AI R&D Team에서 금융 리스크 관리 영역에 대한 AI 기술을 연구·개발하고 있는 ML 엔지니어 김지환입니다.

사실 요즘은 사무실에서 연구·개발하는 비율보다 고객사에 출장 나가있는 비율이 더 높은데요. 출장에서는 주로 고객사 맞춤형 CSS(Credit Scoring System)를 만들고 있습니다. PFCT의 워크스테이션을 고객사에 배치해서 데이터를 넣어주고, 어떤 것도 반출이 안 되게끔 보안 처리를 한 뒤, 그 데이터를 토대로 신용평가모델을 학습하죠. 아무래도 금융 데이터는 민감 데이터이기 때문에, 직접 가서 개발하는 수밖에 없거든요.

그래도 저희 팀의 본업은 역시 연구·개발에 있다고 생각해서, 올해 안에 지금 하고 있는 업무들을 모두 제품화하고 내부로 들어오는 게 목표입니다.

준비 시간이 한 달 반밖에 안 돼서 살짝 걱정했는데, 결과가 잘 나와서 정말 기뻤어요.

특히 신한카드와의 협업에서 얻은 인사이트를 기반으로 우리 기술력을 제대로 보여줄 수 있는 자리였다는 점에서 더 의미 있다고 생각합니다. 이번에 ICLR 중에서도 금융 워크숍 트랙에 논문을 제출한 건데요. 금융 분야에서는 우리 기술력이 꽤 강하다고 생각해서 논문 쓸 때도 자신은 있었습니다. (웃음)

음, 크게 두 가지를 근거로 들고 싶어요. 하나는 여신(Lending) 시장에서 긴 시간 실무적으로 고민하던 문제를 해결했다는 점이고, 또 하나는 실제 신한카드 데이터로 검증을 했다는 점이요.

원래 이렇게 글로벌 AI 컨퍼런스들을 보면 금융, 특히 여신 쪽 논문이 정말 안 나와요. 그래도 이번엔 아예 금융 분야 워크숍이 따로 열리니까 조금은 다르지 않을까? 기대했는데요. 막상 가서 확인해 보니 여신과 관련된 논문은 거의 없었어요. AI 알고리즘을 활용한 투자 포트폴리오 최적화나 금융 분야에 LLM(Large Language Model)을 적용한 연구들이 주를 이뤘죠. 그래서 이런 두 가지 경쟁력이 확실히 먹힌 것 같아요.

배경부터 설명 드릴게요. 여신 시장에는 금융사들이 오랫동안 풀지 못하던 문제가 있었어요. 바로 ‘대출 실행 전 예측한 리스크와 실제 리스크 사이 큰 차이가 발생하는 것’인데요. 쉽게 말하면, 금융사가 고객이 돈을 갚지 않을 확률을 예측한 것보다 실제 더 많은 고객이 돈을 갚지 않은 거예요. 그러면 금융사 입장에서는 리스크 비용 예측에 실패한 셈이 되고, 수익성이 악화할 수밖에 없죠.

PFCT도 자체 온투금융플랫폼 ‘크플(구. 피플펀드)’을 통해 대출 운영을 거의 10년 동안 해왔잖아요. 같은 문제가 있을 때마다, 저는 ‘우리 대출을 선택할 만한 고객군에 더 큰 가중치를 둬서 리스크를 예측하면 문제가 해결되지 않을까?’ 하는 의문을 가졌어요. 보통 모든 금융사가 대출을 조회하는 전체 고객에게 동일한 가중치를 둬서 리스크를 예측하는데, 그렇게 하면 우리를 선택하지 않을 우량한 고객 때문에 전체 리스크가 낮게 측정될 수 있다는 논리였죠.

예를 들어, 중신용자를 메인 타겟으로 하는 금융사는 실제 취급 시 금리·한도 전략에 따라 중신용자를 더 많이 취급할텐데, 리스크 예측에서는 고신용자에게도 똑같은 가중치를 둬서 보니까 실제 리스크와 차이가 발생한다고 보는 거예요.

네, 정확히는 리스크를 예측할 때 불량 확률과 선택 확률을 동시에 고려하는 멀티태스킹 학습이 핵심이에요.

우선 선택 확률 예측에 신용 데이터와 금리·한도 데이터, 두 개의 데이터 소스를 활용했어요. 이때, 신용 데이터가 300개라고 치면 금리·한도 데이터는 2개인데요. 이 2개의 힘이 300개의 힘을 넘어서는 모습을 보여요. 지금은 대출비교서비스가 대세로 자리 잡은 시장이잖아요. 데이터를 뜯어 보면 고객이 금리·한도에 따라서 금융사를 선택할 지 안 할지가 꽤나 명확하게 갈리거든요.

그래서 금리·한도의 영향력을 높일 수 있는 여러 방법을 실험해보다가 결국에는 두 개의 데이터셋이 아예 하나의 커버처럼 합쳐지는 linear modulation을 택하게 되었습니다. 금리·한도 데이터를 300개 디멘션으로 쫙 늘린 다음에 신용 데이터 300개 각 피쳐에 더하거나 곱해서 새로운 데이터셋을 만드는 방법인데요. 이렇게 하면 금리·한도 데이터가 신용 데이터 전반에 영향을 주게 돼요.

결과적으로, 전체 대출 조회 고객을 대상으로 선택 확률을 예측해서 고객마다 가중치를 계산하고, 그 가중치를 기반으로 불량 확률을 예측하니 실제 리스크 발생 수치와 흡사하게 나와 가설을 증명해낼 수 있었습니다. 사실 단순히 가설을 증명했다는 게 의미가 있는 건 아니고, 고객사와 공동으로 연구한 만큼 실무에 직접 적용해 실제 리스크 비용을 줄이게 될 것에 대한 기대가 더 커요. 관련된 프로젝트도 진행 중에 있습니다.

약간 오해가 있을 수 있는 게, 금융 분야에서 기술로 성과를 낸 사례가 적은 것이지, 다른 분야에서는 좋은 방법론이 이미 많이 제시되어 있어요. 그런 방법론들을 금융에 적용해보는 방식으로 해결책을 찾았습니다.

예를 들면 제가 선택 확률과 불량 확률을 같이 예측하는 ‘멀티태스킹 학습’을 제안했잖아요. 이와 관련된 연구도 비전 쪽에는 이미 많아요. 오래 전 연구이긴 한데, 이미지를 채도, 명도, 그림자 등으로 쪼갠 뒤 각각을 학습해서 그걸 하나의 이미지로 만드는 논문을 읽은 적이 있어요. 그러니까 ‘한 번에 하지 말고 태스크를 나눠서 각각 잘하는 모델을 사용하면 더 잘 하지 않겠냐’ 하는 주장인 거죠.

제 연구도 같은 주장이에요. 불량 예측 모델, 선택 예측 모델을 나눠 학습하면 각각의 태스크가 시너지를 내서 전체적인 성능을 높일 수 있는 모델링 구조를 만들 수 있다고 생각했어요. 그래서 결국 적용하고 싶은 알고리즘이나 구조가 있을 때는 금융 분야에 한정하지 않고 여러 분야에서 문제를 푼 방법을 많이 찾아보고, 금융 데이터에는 어떻게 적용할 수 있을지 고민했습니다.

저는 금융 분야가 되게 좋다고 생각하는 게, 지금까지 저희가 쓰는 알고리즘이나 이런 것들도 사실 금융 분야에 특화돼있다기 보다는 비전이나 텍스트 등 여러 분야에서 잘 사용되고 있는 기술들이거든요. 그래서 그런 기술들을 금융 분야에 맞게 접목하는 게 중요 포인트죠. 그게 또 엔지니어링 기술이기도 하고요. 근데 우리 팀은 그런 것들을 잘하니까요. 강점이 많다고 생각해요.

솔직히 말하자면, 그동안 금융은 기술 연구를 열심히 하지 않아도 수익을 낼 수 있던 분야여서가 아닐까 싶어요. 규제 틀 안에서 한정된 플레이어가 돈 벌기 쉬운 구조를 가지고 있어서 기술 발전을 굳이 추구하지 않아도 됐던 거죠.

그런데 논문에도 적었지만, 코로나랑 경기 침체를 겪으면서 지금 금융사들이 조금씩 기조가 바뀌고 있거든요. 저는 현장을 다니니까 체감이 더 확 되는데요. 리스크를 왜 관리해야 하는지에 대해서 점점 더 공감대가 생겨나고 있고, 이를 위해 이제 막 AI 기술을 도입해 보려고 하는 단계에 있는 것 같아요. 다른 분야에 비해서는 조금 늦은 거죠. 그래도 점점 더 많아질 거라고 생각해요.

PFCT는 설립 당시부터 ‘기술이 금융을 혁신한다’는 믿음을 가지고 기술에 많은 투자를 해왔잖아요. 점점 결실을 보고 있는 게 아닐까 싶어요.

저는 진심으로 ‘금융 리스크 관리 영역에서 우리만큼 깊이 고민한 기술팀은 없다’고 생각해요. 저희 정말 말도 안 되는 시도도 많이 해봤거든요. 비전이 너무 잘 되니까 신용데이터를 이미지로 분석해보기도 하고… 하여튼 특이한 거 정말 많이 했어요. (웃음) 물론 실패를 거듭했지만, 그 과정에서 인사이트가 정말 많이 쌓였던 것 같아요.

이번 연구도 마찬가지에요. 사실 논문을 한 달 반 만에 쓴다는 게 말이 안 되는 거거든요. 근데 가능했던 게, 오랫동안 고민해오던 주제여서인 것 같아요. 2년 전쯤에도 같은 주제로 연구를 진행했었는데, 데이터가 충분치 않아 명확한 결과를 얻지 못했거든요. 그때 부족했던 부분과 개선 아이디어들을 메모로 남겨두었는데, 이번 논문을 준비하면서 그 기록들을 적극 활용했어요. 덕분에 짧은 기간에도 논문을 완성할 수 있었던 것 같아요.

물론 그렇지만, 회사 차원에서 지원을 많이 해준 게 더 크다고 생각해요.

사실 저희가 오랫동안 돈을 못 버는 연구 조직이었잖아요. 그래도 눈치를 많이 안 봤던 것 같아요. 팀 내부에서 ‘이런 것들을 해보고 싶다’ 하면 적극적으로 할 수 있게 지원을 해주셨거든요. 그게 지금 연구를 하거나 모델링 하는 데 도움이 많이 되고 있어요. 뭐 병규님(팀 리더)이 티 안 내고 고생 많이 하셨을 지는 모르겠지만. (웃음)

그런 시간을 거쳐온 덕분에 지금 이렇게 신한카드와 공동 연구도 할 수 있었다고 생각해요. 방대한 데이터를 다루는 기회도 가져보고, 대형 금융사의 금리·한도 전략을 직접 볼 수도 있고, 개인적으로 굉장히 뜻깊었습니다.

음… 일단 금융 데이터는 본연의 특징이 좀 명확하다는 게 매력적인 것 같아요. 가령, 다른 분야에서는 크게 신경 쓰지 않는 보안적인 이슈도 고려해야 하고, 요즘 뜨고 있는 공정성의 측면도 고려해야 하죠. 이런 보수적인 제약을 어떻게 해결할지도 되게 큰 연구 주제거든요. 그런 걸 고려하면서 모델링하는 게 오히려 난제를 푸는 관점에서 흥미롭다고 생각해요.

다른 하나의 측면은 효용성을 느끼기 좋다는 점이에요. 앞서도 말씀 드렸지만, 결국 리스크 관리는 매출과 직결될 수밖에 없거든요. 그래서 사실 이런 것들을 다루면서 ‘내가 왜 이 모델을 잘 만들어야 하는가’, 그리고 ‘잘 만들었을 때 어떤 효과가 있는가’가 명확하게 느껴지다 보니까 연구·개발을 하는 데 동기부여가 되고, 더 재밌다고 느끼는 것 같아요.

네 맞아요. 저는 PFCT에 2020년에 합류했는데요. 석사 졸업 후 커리어를 iOS 개발자로 시작해서, PFCT에도 iOS 개발자로 합류했습니다. 그러다 저희 팀 리더이자 VPAI(Vice President of AI)를 맡고 있는 병규님의 권유로 ML 엔지니어로 직무를 전환해서 지금까지 일하고 있어요.

사실 iOS는 워낙 어릴 때부터 해왔던 측면이 있고요. 대학원에서는 비전 연구를 했어서 ML도 낯설지 않았어요. 덕분에 전환이 용이했죠.

( 이전 인터뷰 보러가기: <카이스트 석사 개발자가 말하는 직장 선택의 기준>)

‘여신(Lending)의 핵심을 다뤄보고 싶지 않냐’ 하시던데요? (웃음) 그 말이 굉장히 공감 갔어요.

PFCT에 있는 많은 분들이 그러하듯, 저도 회사에 합류하기로 결정한 가장 큰 이유가 ‘금리 간극을 메꾸는 것’이었거든요. 1금융권과 2금융권 사이 금리 간극이 굉장히 큰데, 이런 사회적 구조 안에서 우리가 최적의 금리를 제시해서 그 사이를 메꾸면 많은 사람들이 도움을 받을 수 있겠다 생각했죠.

그런데 병규님으로부터 제안을 받고는 왠지 모르게 ‘재밌을 것 같다’는 생각이 들더라고요. 이런 생각이 왜 들까, 곰곰이 생각해보니 결국 제가 좋아했던 건 개발 그 자체가 아닌, ‘개발의 결과물이 실제 사람들한테 쓰이고, 도움이 되는 것’이라는 걸 깨달았어요. 그걸 깨닫고 나니 더이상 고민할 필요가 없었습니다. 보다 직접적으로 사람들에게 영향을 줄 수 있는 ML 엔지니어라면, 무조건 해야겠다 싶었죠.

앞으로도 ‘성과를 내는 기술’들을 만들어가고 싶어요. 이번에 컨퍼런스에 가서도 체감했는데, 역시 중요한 건 ‘이런 기술을 사용해봤다’가 아니라, ‘이 기술을 통해 이런 문제를 수치적으로 개선했다’여야 한다는 생각을 했어요.

( ICLR 참석기 보러가기: <AI의 최전선에서 금융의 미래를 그리다>)

가령, 요즘 저희가 LLM을 리스크 관리 영역에 도입하려는 시도를 계속하고 있는데요. 이때도 ‘LLM을 이용해 업무 생산성이 2배가 되게 했다’든지, ‘업무 시간을 2배 줄였다든지’ 하는 실질적인 성과를 만들어내는 게 목표입니다.

이외에도 풀고 싶은 문제는 여전히 많은데요. 그 중 하나가 시간이 지남에 따라 모델이 성능이 떨어진다거나, 특성이 달라진다거나 하는 문제에요. 그런 것들을 거시 경제 기반으로 어떻게 예측할 수 있을지, 그래서 모델의 안정성을 어떻게 강화할 건지에 대해 계속 연구하면서 이런 저런 시도를 해나가고 있거든요. 그게 가능해지면 또 다른 차원이 펼쳐질 거라서, 꼭 풀어내고 싶습니다.

이렇게 문제를 하나하나 기술로 해결해감으로써 시장을 혁신하다 보면, 저희가 꿈꾸는 ‘보통 사람을 위한 보통이 아닌 금융’을 실현할 수 있는 날이 반드시 열린다고 믿어요. 제가 하는 일이 미션과 직결되어 있다는 사명감을 가지고 앞으로도 즐겁게 일하겠습니다.

edited by Hoonjung
filmed by Gihwan


여신 시장의 고질적 문제들을 기술로 풀어내고 싶다면?