트리플 배리어(Triple Barrier) 레이블링 변형 기법

배움의 끝 2025. 12. 12. 14:11

2025. 12. 12. 14:11

핵심: "가격이 올랐는가?"가 아니라 "추세가 얼마나 견고한가?"를 측정

기존 방식은 특정 시점의 가격만 보고 레이블링하기 때문에, 가격이 요동치다가 우연히 높게 끝난 경우도 '상승'으로 잘못 판단할 수 있습니다. 이 기법은 추세의 강도와 일관성을 봅니다.

작동 원리 (Trend Scanning):
- 단순 등락률 대신, 윈도우 내 가격 움직임에 대해 **선형 회귀(Linear Regression)**를 수행합니다.
- 회귀선의 **기울기(Slope)**와 그 유의성을 나타내는 **$t$-값($t$-value)**을 계산합니다.
- $t$-값이 특정 임계값(예: 2.0)을 넘으면 확실한 상승 추세, -2.0 미만이면 하락 추세로 레이블링합니다.
장점: 변동성이 큰 횡보장에서 발생하는 '거짓 신호(False Positive)'를 효과적으로 걸러냅니다.
활용: 추세 추종(Trend Following) 전략의 머신러닝 모델 학습용 타겟으로 매우 적합합니다.

핵심: 단일 자산 가격이 아닌, 두 자산 간의 "스프레드(Spread)"에 배리어 적용

일반적인 트리플 배리어는 단일 주식의 가격을 기준으로 하지만, 페어 트레이딩(Pair Trading)은 두 자산의 가격 차이(Spread)가 **평균으로 회귀(Mean Reversion)**하는 성질을 이용합니다.

작동 원리:
1. 자산 구성: 자산 A와 자산 B의 스프레드(또는 Z-Score)를 계산합니다.
2. 배리어 설정:
  - 상단 배리어(Profit Take): 스프레드가 평균(0)으로 돌아오는 지점.
  - 하단 배리어(Stop Loss): 스프레드가 평균에서 너무 멀어져 통계적 범위를 벗어나는 지점 (손절 라인).
3. 레이블링: 스프레드가 평균으로 돌아오면 성공(1), 손절 라인을 건드리면 실패(-1), 시간 내에 돌아오지 않으면(0)으로 분류합니다.
장점: 공적분(Cointegration) 관계가 깨지는 위험을 데이터셋 단계에서 반영할 수 있습니다.

핵심: 시장의 "변동성"에 따라 골대(임계값)의 크기를 실시간 조절

고정된 임계값(예: 2% 상승 시 매수)을 사용하면, 변동성이 낮은 장세에서는 신호가 전혀 안 잡히고, 변동성이 큰 장세에서는 신호가 너무 많이 잡히는 문제가 있습니다.

작동 원리:
- 최근 시장의 변동성 지표(주로 ATR 또는 표준편차)를 계산합니다.
- 이 변동성 지표의 $N$배(예: $2 \times \text{ATR}$)를 동적 임계값으로 설정합니다.
- 공식 예시:
- $$Upper Barrier_t = Price_t \times (1 + k \times Volatility_t)$$
2024년 트렌드: 최근 연구들은 단순 변동성뿐만 아니라, 시장의 국면(Regime)을 탐지하여 임계값을 비선형적으로 조절하는 방식까지 포함합니다.
장점: 시장 상황(변동성 장세 vs 횡보 장세)에 관계없이 일관된 통계적 의미를 갖는 레이블을 생성합니다.

핵심: 최적의 익절/손절 폭과 보유 기간을 "진화 알고리즘"이 찾아냄

"익절 폭을 3%로 할까, 5%로 할까?"는 인간의 주관이 개입되기 쉽습니다. 이 기법은 유전 알고리즘(GA)을 사용하여 모델의 성과를 극대화하는 파라미터를 자동으로 탐색합니다.

작동 원리:
1. 유전자 설정: 트리플 배리어의 파라미터(익절 폭, 손절 폭, 보유 기간)를 유전자로 정의합니다.
2. 진화 과정: 초기 무작위 값에서 시작하여, 모델의 성과(Sharpe Ratio, 정확도 등)가 좋은 파라미터 조합만 남깁니다(Selection).
3. 교차 및 변이: 남은 파라미터들을 섞거나(Crossover) 미세하게 조정(Mutation)하여 최적해를 찾습니다.
장점: 데이터에 내재된 최적의 수익/위험 비율을 찾아내어, 인간의 편향(Bias)을 제거한 객관적인 레이블링이 가능합니다.

[논문] Revisiting the 'Video' in Video-Language Understanding (CVPR 2022) (0)	2025.11.21
[RL] PPO, DPO, GRPO 비교 (0)	2025.11.18
Self-Attention (셀프 어텐션) vs. 채널 어텐션 (Channel Attention) 비교 (0)	2025.11.17
PokéChamp: An Expert-level Minimax Language Agent \| ICML 2025 Spotlight (0)	2025.11.09
[논문 요약] VERBALIZED SAMPLING: HOW TO MITIGATE MODE COLLAPSE AND UNLOCK LLM DIVERSITY (0)	2025.11.06

LLM과 세상 탐험