기존보다 많은 데이터 활용해 모형 성능 높일 수 있는 방법론 제시

카카오뱅크 판교오피스. [사진: 카카오뱅크]
카카오뱅크 판교오피스. [사진: 카카오뱅크]

[디지털투데이 강진규 기자] 카카오뱅크는 자사 금융기술연구소와 빅데이터분석팀이 공동으로 연구 개발한 '2단계 신용평가모형 연구(Two-stage credit scoring using Bayesian approach)' 논문이 국제 저명 학술지에 게재됐다고 29일 밝혔다.

연구 결과 논문은 빅데이터 이론 및 방법론 부문의 국제 학술지인 ‘저널 오브 빅데이터(Journal of Big Data)’에 게재됐다.

2단계 신용평가모형은 기존보다 더 많은 설명 변수(데이터 종류)를 적용할 수 있는 신용평가모형 개발 방법론으로, 보다 다양한 변수를 사용해 평가 성능을 개선하면서 동시에 모형의 설명 가능성을 유지하는 것이 가능하다.

카카오뱅크는 대부분의 금융사들이 로지스틱 회귀분석을 사용해 신용평가모형을 개발하고 있으나 이는 설명 변수들이 상호 독립적이어야 한다는 가정으로 인해 최대 10개 내외의 변수만을 모델에 적용이 가능하다고 설명했다. 새로운 변수를 발굴하더라도 독립성의 제약으로 인해 기존의 변수들을 사용할 수 없다는 점에서 성능 개선의 한계가 존재했다는 것이다.

카카오뱅크는 이번 연구가 변수의 숫자를 크게 확대해 성능을 개선하면서도 동시에 설명 가능성도 유지하는 방법론과 이론적 근거를 제시했다는 점에서 의미가 있다고 강조했다.

2단계 신용평가모형 기술은 카카오뱅크가 최근 개발한 독자적인 대안신용평가모형인 '카카오뱅크 스코어'에도 적용됐다. 카카오뱅크 스코어는 '가명정보 활용 우수사례 경진대회'에서 데이터 가명결합을 통한 대안신용평가모형 개발 사례로 대상을 수상한 바 있다.

카카오뱅크 관계자는 “지속적으로 신용평가 모형 기술을 개발함으로써 금융 이력 부족 고객에게 합리적인 평가 체계를 제공하고 금융포용을 강화할 것”이라고 말했다.

관련기사

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지