News & Events
페어 트레이딩 (Pairs Trading) – 추가편 (25)
페어 트레이딩의 단기 전략 (1)
페어 트레이딩의 단기 전략을 위해서는 스프레드의 기술적 분석이 필요해 보인다. 단방향 (Long only) 주가 차트는 랜덤 워크 특성이 강하게 나타나므로 단기적 예측에 어려움이 있다. 그러나 페어 트레이딩의 스프레드 차트는 단기적으로는 랜덤 워크 특성이 나타나긴 하지만, 평균 회귀 특성도 같이 나타나기 때문에 기술적 분석이 도움이 될 수 있다 (가정 사항). 이번 시간에는 스프레드의 기술적 분석을 통해 향후 스프레드를 예측하는 방법론에 대해 살펴보기로 한다.
이전 포스트에서 언급한 것처럼 스프레드에 영향을 미치는 요인은 여러 가지가 있을 수 있다. 스프레드에 영향을 미치는 요인들을 잘 선별해서, 과거의 요인들이 현재 스프레드에 어떤 영향을 주었는지 분석 (학습 : Learning)할 수 있다면, 현재의 요인들로 미래의 스프레드를 예측해 볼 수 있다.
아래 예는 LG디스플레이와 SK하이닉스의 최근 2년간 스프레드를 차트로 그린 것이다. 베타는 임의로 1로 지정했고, 일일 스프레드를 계산한 후, 일주일 단위로 시가 (Open), 고가 (High), 저가 (Low), 종가 (Close)를 구해서 캔들 차트로 그렸다 (R의 quantmod 패키지를 이용하였음).
향후 스프레드에 영향을 미치는 요인으로 몇 가지를 꼽아 보았다. (1) 스프레드의 현재 수준은 향후 스프레드에 영향을 미칠 것이다. 이것은 스프레드에 평균 회귀 특성이 있다는 가정 하에, 현재 스프레드가 높은 수준에 있다면 앞으로는 낮아질 가능성이 있고, 현재 스프레드가 낮은 수준에 있다면 앞으로는 높아질 가능성이 있기 때문이다. 그러나 스프레드의 절대적인 수준만으로는 미래를 예측하기 어렵다. 그 이유는 스프레드가 동일한 수준에 있어도 올라가는 중인지, 떨어지는 중인지에 따라 향후 스프레드의 위치가 달라질 수 있기 때문이다. 이를 보완하기 위해서는 (2) 스프레드의 방향도 고려해야 한다.
스프레드의 방향과 더불어, 이 방향으로 얼마나 빠른 속도로 움직였는지도 고려해야한다. 이 요인은 (3) 스프레드 방향의 강도로 측정할 수 있다. 또한, (4) 스프레드의 변동성과 (5) 각 종목의 일일 거래량도 스프레드 변화에 영향을 미칠 수 있다. 이외에도 시장 변동성, 다른 페어들의 움직임, 또는 기관/외국인 등 주요 거래자들의 수요/공급 같은 것들도 요인으로 고려할 수 있다.
그럼 이렇게 많은 요인들을 어떻게 효과적으로 분석해서 하나의 결론을 얻을 수 있을까? 이에 대한 해결책으로 기계학습 (Machine Learning)에 의한 분석을 생각해 볼 수 있다. 여러 요인들을 체계적으로 분석 (학습)하려면 아래와 같은 절차가 필요하다. 첫 번째 단계 (Feature Generation)에서는 스프레드에 영향을 미치는 요인들을 최대한 선택한 후 각 요인들에 대해 분석한다. 그 다음 (Feature Aggregation)은 각 요인들을 하나로 통합해서 학습이 가능한 형태로 변환한다. 그리고 통합된 과거의 요인들과 스프레드의 관계를 학습 (Learning)한다. 마지막으로는 학습한 경험을 현재의 요인들에 적용하여 미래를 예측하고 성과 (Prediction & Test)를 분석한다. 이 결과를 이용해서 최종 의사결정을 내린다.
1. 개별 요인 분석 (Feature Generation)
스프레드에 영향을 미치는 요인을 하나씩 선별해서 각각의 특성 (Feature)을 분석한다. 각 Feature들은 학습이 가능한 형태여야 하고, 학습의 효율을 높일 수 있도록 구성되어야 한다. 스프레드의 현재 수준 (Factor #1, 혹은 Feature #1)은 그 자체로 하나의 Feature가 될 수 있다. 스프레드는 그 자체로 높거나 낮은 수준 (Level)을 표현하고 있기 때문이다. 다만, 학습의 효율을 높이기 위해서 칼만 필터 (Kalman filter) 같은 것으로 노이즈를 제거해 주는 것도 좋다 (실제 Cross validation 테스트 결과 예측 효율이 약 1% 정도 증가하였음).
스프레드의 방향 (Feature #2)은 현재 스프레드가 아래로 향하고 있는지, 위로 향하고 있는지에 대한 정보를 표현한다. 이것을 판단하기 위해서는 단기, 장기 이동평균선의 위치로 판단한다. 단기 이평선이 장기 이평선보다 위에 있을 때는 “상승 중”으로 판단하고, 반대인 경우는 “하락 중”으로 판단한다. 후행성을 줄이기 위해 지수 이동평균선 (EMA)을 사용하면 무난하다. 단, 주의할 것은 후행성을 완전히 없애기 위해 Kernel, Spline, HP filter (Hodrick-Prescott filter) 같은 것을 사용하면 안 된다. 이것은 후행성을 없애기 위해 미래의 (분석 시점에서) 스프레드를 이용하므로, 올바른 학습이 될 수 없다.
스프레드의 추세 강도(Feature #3)는 스토캐스틱이나 ADX 같은 기술적 지표로 표현해 볼 수 있다. 스프레드의 변동성 (Feature #4)는 과거 n-일 간 스프레드의 표준 편차로 측정할 수 있다. 그리고 거래량 (Feature #5)은 두 종목 간 거래량의 차이로 표현해 볼 수 있다. 이외에도 캔들의 패턴, 변곡점 (trend reversal), 주요 거래자의 수요/공급량 등 많은 요인들을 생성해 볼 수 있다.
여기까지 스프레드의 단기 예측을 위한 분석 절차를 간략히 살펴보았고, 첫 단계인 개별 요인 분석 단계에 대해 살펴보았다. 나머지 단계는 다음 포스트에서 알아보기로 한다.
[출처]41. 페어 트레이딩의 단기 전략 (1)|작성자아마퀀트