News & Events
[페어 트레이딩/고급편] 19. AR(1) 모형 (Autoregressive Model)
- 2019년 1월 7일
- Posted by: 인사이트캠퍼스
- Category: 금융/AI/IT 기사
페어트레이딩 (Pairs Trading) – 추가편(3)
AR(1) 모형 (Autoregressive Model)
이전 시간에 공적분 계수를 추정할 때, 스프레드의 정상성이 최대가 되는 조건은 자기상관계수가 최소가 되는 조건과 동일하다는 원리를 이용하였다. 이번 시간에는 이 논리가 왜 타당한 지에 대해 알아보기로 한다.
정상 시계열에 대해 간단한 모형을 만들어 보면 아래와 같다. 현재 시점의 정상 시계열 (ex: 페어 트레이딩의 스프레드)은 이전 시점의 정상 시계열에 상수 (a)를 곱해준 것과 유사하고, 잔차 정도의 차이만 있음을 모형화 한 것이다. 이 모형을 AR (Autoregressive) 모형이라 하고 (자기회귀모형), 바로 이전 시점 (t-1 시점) 까지만 고려하면 AR(1), 그 이전 까지 모두 고려해 주면 일반적으로 AR(p) 모형이라 한다. 여기서는 간단히 AR(1) 모형에 대해서만 살펴보기로 한다.
위 모형에서 상수 a 에 대해 자세히 알아보자. Xt가 정상 시계열이 되기 위한 a의 범위는 -1 < a < 1 이어야 한다. 이 범위를 벗어나면 Xt는 정상 시계열이 되지 못하고 발산하는 형태의 Random Walk이 된다.
아래 그림은 엑셀에서 -0.5에서 +0.5 사이에 임의의 잔차를 생성하고, a 값을 변화 시켜가면서 AR(1) 모형을 비교해본 것이다. a=0.5 일 때는 정상성이 높고, a=1.005 일 때는 정상성이 없는 비정상 시계열이 된다. 즉, AR(1)은 a 값이 0에 가까울수록 (a의 절대값이 작을수록) 정상성이 높은 시계열이 된다. 페어 트레이딩의 스프레드가 AR(1) 모형을 따른다면 a 값이 작아질수록 스프레드의 정상성이 높아지는 것이다.
이번에는 a 가 실제로 무엇을 의미하는지 알아보자. 아래 식은 AR(1) 시계열의 분산, 공분산 및 자기상관계수 (시차=1)를 계산한 것이다. 1) 정상 시계열의 조건을 이용하면 2) 분산, 및 3) 공분산을 계산할 수 있다. 또한, 분산과 공분산을 이용하면 4) 자기상관계수 (시차=1)을 계산할 수 있다. 자기상관계수가 바로 AR(1)의 상수값인 a 가 된다. 위에서 살펴본 대로 a가 작을수록 AR(1)의 정상성이 높아지므로, 자기상관계수가 작을수록 AR(1)의 정상성은 높아진다.
이번에는 다른 측면에서 a 값의 의미를 살펴보자. 자기상관계수 (시차=1)는 아래의 식 1)로 계산할 수 있다. 그리고 AR(1)의 잔차 제곱의 합이 최소가 되는 a 값을 계산해 보면 식 2)와 같이 된다. 이 결과도 a = 자기상관계수 (시차=1)가 된다.
위의 계산 결과를 요약해 보면 아래와 같다.
1. 상수값 a 가 작을수록 AR(1)의 정상성은 높아진다.
2. AR(1)의 상수값 a 는 자기상관계수 (시차=1)와 같다.
3. 따라서, AR(1)의 자기상관계수가 작아질수록 AR(1)의 정상성은 높아진다.
4. 페에 트레이딩의 스프레드에 AR(1) 과정을 적용하면, 스프레드의 자기상관계수가 작아질수록 스프레드의 정상성은 높아진다.
이 논리를 적용하면 수치해석 (해찾기)을 통해 공적분 계수를 추정할 수 있다. 사실 이 절차는 DF (Dicky-Fuller) 검정의 원리가 된다. AR(1) 모형대신 AR(p)나 ARMA(p,q)등 더 일반화된 모형을 적용하면 ADF (Augmented Dicky-Fuller) 검정의 원리가 된다. 시계열의 정상성에 대해 학술적으로 엄밀히 규정하기 위해서는 ADF 검정 방법이 널리 사용되지만, 페어 트레이딩의 실무를 위해서는 위의 논리를 적용한 DF 검정 원리를 사용해도 무리가 없다.