News & Events
[알고리즘 트레이딩/전략편] 53. 텍스트 데이터 분석 [토픽 모델] – (2) TF-IDF와 TDM
- 2019년 1월 11일
- Posted by: 인사이트캠퍼스
- Category: 금융/AI/IT 기사
댓글이 없습니다
안녕하세요. 이번 시간에는 텍스트 데이터를 수치 데이터로 변환하는 방법에 대해 살펴보겠습니다.텍스트 데이터를 통계적으로 처리하기 위해서는 정형화된 수치 데이터로 변환할 필요가 있는데요, TF-IDF 라는 측정치를 사용한 Term-Document Matrix (TDM)이라는 형태를 이용합니다.
이번 시간에는 TF-IDF 를 이용한 TDM을 활용한 예제로 구글이나 네이버 같은 곳에서 문서의 검색 순위를 결정하는 원리에 대해 살펴보기로 하겠습니다.
1. 텍스트 데이터 분석 [토픽 모델] – (1) 개요
2. 텍스트 데이터 분석 [토픽 모델] – (2) TF-IDF와 TDM
3. 텍스트 데이터 분석 [토픽 모델] – (3) 주제 별 Clustering
4. 텍스트 데이터 분석 [토픽 모델] – (4) LDA 모형
5. 텍스트 데이터 분석 [토픽 모델] – (5) 토픽 추론 (예시)