[Machine Learning] 7. 매트릭스와 벡터 계산하기(Linear algebra)
이번에는 선형대수학(Linear algebra)에 대해서 공부를 합니다. 이름은 거창하지만 실제로는 더하기, 곱하기 이런 기본 산수 수준인데 단지 다른 것은 알고리즘을 사용하기 위해서 필요한 행렬과 벡터 위주로 다루고 있습니다. 행렬이나 벡터도 이름만 거창하지 실제로는 여러번 산수해야하는 것을 한번에 산수하면 되도록 해주는 도구라고 생각하면 될 것 같습니다. 알아두면 매우 유용한 면이 많아 보이는 내용입니다. 예를 들어서, 1+1, 1+2, […]
지난번에 Cost 함수에 대해서 알아보았습니다. 이번에는 Cost 함수를 minimizing 하기 위한 알고리즘에 대해서 알아보겠습니다. 이 알고리즘의 이름은 Gradient descent algorithm이라고 합니다. 변역해서 이야기 하면 경사면을 하강하는 알고리즘이 되는데 실제로도 그렇습니다. 우리는 기본이 되는 linear regression에서 하나씩 살펴보고 있지만 실제로 이 알고리즘은 여러 다양한 분야에서 범용적으로 사용이 되는 알고리즘입니다. 중요하다는 뜻이 되겠습니다. Cost 함수를 minimizing하기 위한 […]
우리는 Supervised 방식을 공부하고 있기 때문에 결과 값을 비교할 수 있습니다. 왜냐하면 실제 정확한 결과 값을 알고 있기 때문입니다. 이 결과 값을 비교할 수 있는 표현이 Cost입니다. 그리고 Cost를 수학적인 함수로 표현하는 것도 배우게 될 것입니다. 이전 내용에서 이어서 h 함수를 일차방정식으로 표현할 수 있었습니다. ( h = Ax + B) 여기서 A와 B를 Parameters라고 […]
이제 한걸음 들어가게 됩니다. 앞에서 공부했던 Supervised Learning에서 regression 에 대한 예시를 가지고 이것을 수학적인 표현식으로는 어떻게 표현이 되는지를 보겠습니다. 집의 사이즈에 따라서 집의 매매가격의 변화하는 데이터를 그래프로 표현하면 아래와 같습니다. 사이즈가 커지면 가격이 높아지니 선을 하나 그어볼 수 있을 것입니다. 이 직선은 사이즈와 가격에 대한 변화를 아주 잘 나타내는 그래프이자 수학적으로는 일차방정식으로 표현이 됩니다. […]
머신이 학습을 하는 방식은 Supervised Learning과 Unsupervised Learning의 2가지로 구분이 됩니다. 이는 기초 데이터인 Dataset의 성격과 원하는 결과 값의 성격에 따라 다르게 사용이 됩니다. Supervised Learning 변역하면 지도식 학습 방법입니다. 선생님이 학생을 교육하듯이 이미 답을 알고 있는 상태에서 학습을 하는 경우입니다. DataSet이 이미 결과 값을 포함하고 있어 머신이 학습을 수행하여 나온 결과 값이 얼마정도의 오차를 가지고 […]
Machine Learning 머신 러닝의 기본 방식은 크게 3가지로 구성이 됩니다. 분석하고자 하는 데이터를 기초로 머신이 학습 또는 task를 수행하게 되고 그 수행결과 값이 실제 값과 같은지를 판단하는 과정으로 진행이 됩니다. 여기에서 사용되는 기초 데이터를 Dataset 이라고 하며 데이터는 수량이 많고 다양할 수록 좋은 데이터가 될 것입니다. 이러한 데이터를 수집하는 단계가 있을 것입니다. 그리고 머신이 학습을 수행하는 단계에서 앞으로 […]
머신러닝 분야에 세계적인 권위를 가지고 계신 Andrew Ng 교수님의 무료강좌를 공부하면서 정리를 해보려고 합니다. https://www.coursera.org/learn/machine-learning/lecture/RKFpn/welcome 초기 몇개의 강의는 한글로 된 transcirpt이 지원이 되고 있습니다. 조금 지나면 모든 강의를 한글 스크릡트로 볼수 있게 될 것 같습니다. 아래는 소개글인데 너무 멋지고 별도로 요약정리할 필요도 없을 것 같아서 그냥 퍼왔습니다. 한번씩 읽어만 봐도 왜 우리가 머신러닝을 배워야 하는지 자연스럽게 […]
기술적 분석 (15) Trailing Stop의 특성 분석이번 시간에는 Trailing Stop의 특성을 분석한 논문 한 편을 소개해 보기로 한다 [1]. 1995년 Glynn과 Iglehart는 “Trading Securities Using Trailing Stops” 라는 논문에서 Trailing Stop 모형의 기대수익, Risk, 평균 청산기간 등을 계산하였고, 최적 Stop Loss (L)의 수준이 존재하는지 여부를 확인해 보았다. 아래 그림은 단순 랜덤워크 과정이다 (이산모형). 주가가 상승하면 +1 증가하고, […]
기술적 분석 (14) 청산 전략과 Trailing Stop 하나의 전략을 성공적으로 완성하려면 진입 전략과 청산 전략을 조화롭게 운영해야 한다. 진입 전략이 성공하더라도 청산 전략이 실패한다면 충분한 수익이 보장되지 않는다. 예를 들어 주가가 오를 것으로 판단하여 매수 진입하였는데 예상대로 주가가 상승하는 경우, 너무 일찍 청산하여 더 큰 수익의 기회를 놓치거나, 더 오를 것을 기대했다가 주가가 다시 하락한 […]
기술적 분석 (13) 최적 매도 시점을 활용한 기술적 지표 이전 시간에 살펴본 최적 매도 시점의 아이디어를 하나의 기술적 지표로 활용해 보면 어떨까? 이번 시간에는 랜덤워크에 대해 이 지표를 적용해 보고 그 성과를 분석해 보기로 한다 (이 지표의 이름을 OSS (Optimal Stopping Signal) 라고 하자). 이전 포스트의 [그림 – 2]에서 언급한 신호를 시험해보기 위해 간단히 프로그램을 작성해 […]