News & Events
NLP 이해하기
컴퓨터가 자연어를 이해하고 사용하는 방법에 대한 토대는 언어학, 신경 과학, 수학, 컴퓨터 과학 등 다양한 분야에서 파생되며 NLP라는 학제 간 영역을 도출한다. NLP는 인공지능(AI)의 하위 분야이며 머신러닝(ML) 알고리즘의 출현과 계산능력의 증가로 NLP는 훨씬 더 확장적이고 신뢰할 수 있게 되었다.
TechCrunch에서 언급했듯이, 지난 3년 동안 NLP는 AI의 다른 어떤 하위 분야보다 더 많은 발전을 이루었다. NLP 기반 애플리케이션은 아마존 에코나 알렉사 같은 홈 어시스턴트부터 챗봇 등 어디에나 있다. NLP 혁명의 촉매는 일부 조직에서만 사용할 수 있는 제한된 데이터 세트와는 달리, 개방적이고 달성 가능한 데이터 세트였다.
또한 NLP 모델의 실행 가능성은 영어 외에도 많은 언어로 확장되어 다양한 플랫폼에서 거의 완벽한 머신 러닝 알고리즘을 가능하게 했다. NLP 툴, 기술 및 API(Application Programming Interface)는 이제 금융을 포함한 다양한 산업에 널리 퍼져 있다. 따라서 지금이 금융 분야의 NLP 솔루션을 구축할 절호의 기회이다.
→ 기업은 NLP를 어떻게 활용할 수 있을까? 자연어 처리 응용 프로그램의 주요 영역은 무엇인가? 의료 분야에 NLP를 활용한 경험이 있는 Avenga는 이 주제에 대한 인사이트를 보유하고 있다.
오늘날 데이터는 금융을 주도하고 있으며 가장 중요한 데이터는 문서, 텍스트, 웹 사이트, 포럼 등에서 서면 형태로 찾을 수 있다. 재무 전문가들은 분석 보고서, 금융 언론 등을 읽는 데 상당한 시간을 소비한다. 자동 텍스트 데이터 처리는 수동 루틴 작업의 양을 크게 줄이고 거래를 가속화할 수 있다.
NLP 기술과 알고리즘은 원시 텍스트 데이터를 재무의 여러 영역에 걸쳐 의미 있는 인사이트로 변환하는 데 도움이 된다. 거래자, 포트폴리오 관리자, 분석가, 은행 및 기타 금융 조직은 재무 분석을 개선하기 위해 노력하고 있으며, NLP와 ML은 선택의 기술이 되었다. NLP는 소매 금융부터 헤지 펀드 투자에 이르기까지 금융 산업 전반에 걸쳐 사용된다. 감정 분석, 질문-응답(챗봇), 문서 분류 및 토픽 클러스터링과 같은 NLP 기술은 구조화되지 않은 재무 데이터를 처리하는 데 사용된다.
NLP와 ML 기술을 사용하여 실시간으로 정보에 입각한 의사결정을 내릴 수 있는 금융 인프라를 설계할 수 있다. NLP는 기업의 변화하는 특성을 추적하여 재무 흐름을 강화할 수 있는 시스템을 설계하는 데 도움을 줄 수 있다. 예를 들어 NLP는 다음과 같이 은행의 운영을 개선할 수 있다.
- 고객에게 더 나은 맞춤형 환경 제공
- 부정 거래 및 자금 세탁 활동에 대처하기 위한 더 나은 장비
- 운영 효율성 향상
- 정책 표준 준수 향상
- 새로운 분석 인사이트
- 혁신적인 제품 오퍼링
금융업에서의 NLP 이용 사례
NLP에는 대출 위험 평가, 감사 및 회계, 감성 분석 및 포트폴리오 선택 등 다양하게 이용된다. 다음은 금융 서비스 분야 혁신을 주도하는 NLP의 4가지 예이다.
1. 위험 평가
은행들은 신용 위험 평가에 기초하여 성공적인 대출 상환의 가능성을 정량화할 수 있다. 통상 지급 여력은 과거 지출 패턴과 과거 대출금 지급 내역 데이터를 토대로 산정된다. 그러나 이러한 정보는 특히 가난한 사람들의 경우 이용할 수 없다. 한 추정치에 따르면, 세계 인구의 거의 절반이 빈곤 때문에 금융 서비스를 사용하지 않는다고 한다.
NLP는 이 문제를 해결하기 위해 존재한다. NLP 기법은 신용 위험을 평가하기 위해 복수의 데이터 포인트를 사용한다. 예를 들어, NLP는 기업 대출의 태도와 기업가적 사고방식을 측정할 수 있다. 마찬가지로 일관성이 없는 데이터를 지적하고 보다 정밀한 조사를 수행할 수도 있다. 더욱이, 대출 과정 동안 대출자와 대여자의 감정과 같은 미묘한 측면은 NLP의 도움으로 통합될 수 있다.
보통 기업들은 개인 대출 서류에서 많은 정보를 캡처하여 신용 리스크 모델에 넣어 추가 분석을 한다. 수집된 정보가 신용 위험 평가에 도움이 되지만, 데이터 추출의 실수는 잘못된 평가로 이어질 수 있다. NLP 기술인 NER은 이러한 상황에서 유용하다. NER은 관련 당사자의 날짜, 위치 및 세부 사항을 포함하여 대출 계약에서 추출한 관련 기업을 도출하는 데 도움이 된다.
→ NLP 소셜 그래프 기법이 환자 데이터베이스를 평가하는 데 어떻게 도움이 되는지 읽어 보자. 임상 연구 조직이 임상 시험 분석을 성공적으로 수행할 수 있도록 지원한다.
2. 금융감성
주식 시장에서의 성공적인 거래는 선별된 주식들에 대한 정보에 달려있다. 이러한 지식에 기초하여, 거래자들은 주식을 살 것인지, 보유할 것인지 또는 팔 것인지를 결정할 수 있다. 분기별 재무제표를 분석하는 것 외에도 분석가들이 해당 기업에 대해 뭐라고 하는지 아는 것이 필수적이며, 이러한 정보는 소셜 미디어에서 확인할 수 있다.
소셜 미디어 분석은 소셜 미디어 게시물 내에서 그러한 정보를 모니터링하고 거래를 위한 잠재적 기회를 선택하는 것을 포함한다. 예를 들어 CEO 사임 소식은 보통 부정적인 감정을 전달하고 주가에 부정적인 영향을 미칠 수 있다. 그러나 CEO가 실적이 좋지 않았다면 주식시장은 사임 소식을 긍정적으로 받아들이고 있어 주가가 상승할 가능성이 있다.
DataMinr과 Bloomberg는 거래를 돕기 위해 그러한 정보를 제공하는 회사들 중 일부이다. 예를 들어, DataMinr은 시장에 영향을 미칠 가능성이 있는 터미널의 사용자에게 Dell에 대한 주식별 경고 및 뉴스를 제공했다.
금융 감성 분석은 통상적인 감성 분석과 다르다. 영역과 목적에서 모두 다르다. 규칙적인 감성 분석에서는, 정보가 본질적으로 긍정적인지 아닌지를 찾는 것이 목적이다. 다만 NLP를 기반으로 한 금융 감성 분석에서는 시장이 뉴스에 어떤 반응을 보일지, 주가가 하락할지 상승할지 등을 살펴보는 게 목적이다.
바이오 메디컬 텍스트 마이닝을 위한 사전 훈련된 바이오 메디컬 언어 표현 모델인 BioBERT는 의료에 상당히 유용했으며, 현재 연구자들은 BERT를 재무 영역에 적응시키기 위해 노력하고 있다. FinBERT는 금융 서비스 분야를 위해 개발된 모델 중 하나이다. FinBERT는 로이터의 재무 뉴스를 포함하는 데이터 세트에서 작동한다. 감정을 할당하기 위해 문구 은행을 이용했다. 문구 은행은 기업이나 재무와 무관한 사람들에 의해 분류된 약 4,000개의 문장으로 구성되어 있다.
일반적인 감성 분석에서, 긍정적인 진술은 긍정적인 감정을 암시한다. 그러나 파이낸셜 프레이즈 뱅크에서 부정적인 감정은 발표된 뉴스 때문에 그 회사의 주가가 떨어질 수도 있다는 것을 암시한다. FinBERT는 0.97의 정확도와 0.95의 F1으로 매우 성공적이었으며, 다른 사용 가능한 툴에 비해 상당히 향상되었다. FinBERT 라이브러리는 관련 데이터와 함께 GitHub에서 열립니다. 경제 정서 분류를 위한 이 강력한 언어 모델은 다른 목적으로도 사용될 수 있다.
→ 데이터 사이언스 팀이 기초부터 구축한 감성 분석 알고리즘에 대해 알아보자.
3. 회계 및 감사
Deloitte, Ernst & Young와 PwC는 기업의 연간 성과에 대한 의미 있는 실행 가능한 감사를 제공하는 데 초점을 맞추고 있다. 예를 들어, Deloitte는 감사 명령어(Audit Command Language)를 보다 효율적인 NLP 응용프로그램으로 발전시켰다. 특히 정부 데이터와 문서 검토 및 장기 조달 계약을 체결하기 위해 NLP 기술을 적용했다.
기업들은 이제 감사 과정에서 NLP의 중요성을 깨닫고 있습니다. 특히 수십 년 동안 끊임없는 일일 거래와 송장 같은 서류를 처리한 후에 더욱 그렇습니다. NLP를 사용하면 재무 전문가가 일상적인 트랜잭션에서 이상 징후를 직접 식별, 집중 및 시각화할 수 있다. 올바른 기술을 사용하면 트랜잭션의 불규칙성과 원인을 찾는 데 더 적은 시간과 노력을 들일 수 있다. NLP는 상당한 잠재적 위험과 돈세탁과 같은 사기 가능성을 식별하는 데 도움을 줄 수 있다. 이를 통한 가치 창출 활동을 조직 전체에 전파할 수 있다.
4. 포트폴리오 선택 및 최적화
모든 투자자의 주된 목표는 주가에 의해 발생되는 근본적인 분포에 대한 지식 없이 장기적으로 자본을 극대화하는 것이다. 금융 주식 시장의 투자 전략은 데이터 사이언스, 머신 러닝 및 비모수 통계로 예측할 수 있다. 과거에 수집된 데이터는 거래 기간의 시작과 포트폴리오를 예측하는 데 사용될 수 있다. 이 자료 덕분에, 투자자들은 현재의 자본을 이용 가능한 자산으로 분배할 수 있다.
NLP는 반로그 최적화 포트폴리오 최적화에 활용할 수 있다. 반로그 최적 포트폴리오 선택은 로그 최적 포트폴리오 선택을 위한 계산 대안이다. 이를 통해 환경적 요인이 불확실할 때 가능한 최대 성장률을 달성할 수 있다. 자료 포락 분석은 바람직하고 바람직하지 않은 주식을 걸러냄으로써 포트폴리오 선택에 활용될 수 있다.
5. 주식 행동 예측
재무 분석을 위한 시계열 예측은 변동 및 불규칙한 데이터는 물론 분석에 큰 오류를 일으킬 수 있는 장기 및 계절적 변동 때문에 복잡한 작업이다. 그러나 NLP와 결합된 딥러닝은 금융 시계열로 작업하는 이전의 방법론을 크게 능가한다. 이 두 기술을 결합하면 대량의 정보를 효과적으로 처리할 수 있다.
딥러닝 그 자체는 전혀 새로운 개념이 아니다. 지난 5년 동안 음성 인식 및 의료 이미지 분석과 같은 여러 작업에서 인간보다 더 나은 성능을 발휘하기 시작한 딥 러닝 알고리즘이 대거 등장했다. 금융 영역 내에서 반복 신경망(RNN)은 주가처럼 시계열 예측에 매우 효과적인 방법이다. RNN은 재무 시계열 데이터에 존재하는 복잡한 비선형 관계를 결정하고 높은 정확도로 비선형 함수를 근사화할 수 있는 고유한 기능을 가지고 있다. 이러한 방법은 높은 수준의 정밀도를 제공하기 때문에 기존의 주식 지수 예측 기술에 대한 실행 가능한 대안이다. NLP와 딥러닝 기법은 주가 및 동향의 변동성을 예측하는 데 유용하며 주식 거래 결정을 내리는 데 유용한 도구이기도 하다.
금융 실무에서의 NLP
NLP 기술은 구조화되지 않은 텍스트 정보를 통찰력 있는 분석으로 변환하는 데 사용된다. NLP 알고리즘은 최근 몇 년 동안 훨씬 더 안정적이고 확장성이 높아졌으며, 금융 의사 결정권자들에게 시장에 대한 포괄적인 이해를 제공하고 있다.
금융 업계는 NLP를 활용해 수작업량을 줄이고 거래 가속화, 리스크 평가, 금융 감성 파악, 포트폴리오 구축 등을 병행하면서 감사와 회계를 자동화하고 있다. 이러한 진보는 감성 분석, 질문-응답(챗봇), 토픽 클러스터링 및 문서 분류의 도움을 받아 달성된다.
NLP와 ML은 재무 분석가, 트레이더 및 포트폴리오 관리자에게 필수적인 기술이 되었다. 보험 회사들은 NLP를 활용하여 보험금을 자동으로 처리하는 반면, 소매 은행은 고객 지원을 간소화하고 고객에게 더 나은 금융 상품을 제공하며 사기 및 돈세탁 활동을 처리할 수 있는 더 나은 장비를 갖추고 있다.
2021년은 많은 사람의 투자 방식을 변화시킬 NLP의 파괴적인 기술을 채택하기에 가장 흥미로운 시기이다. NLP 또는 ML 솔루션을 개발하려면 Avenga에 문의하십시오.
오늘 배운 NLP는 인사이트캠퍼스에 개설된
무료 강의를 통해 더 학습할 수 있습니다.
파이썬을 활용한 자연어처리 이론 강의로 NLP에 입문하고 싶은 분들께 추천드립니다.
번역 – 핀인사이트 인턴연구원 강지윤(shety0427@gmail.com)
원문 보러가기>