주식 투자에 통계학 지식이 필요한 이유

"이 정도 폭락은 모델상 불가능합니다" — 정규분포가 거짓말하는 방식

Stock & Data 2026. 5. 7. 10:34
📅 작성·갱신:
2020년 3월 8거래일 — 모든 날이 4시그마 이상 변동, 정규분포로는 우주 나이보다 긴 시간이 필요한 사건

이 글의 결론 — 한눈에 보기

  1. 시장은 종형 곡선을 따르지 않는다. "있을 수 없는 폭락"은 평균 수년에 한 번 정기적으로 일어난다.
  2. 5,000일 중 10일이 20년 수익의 절반을 결정한다. 그 10일은 예측 불가능하고, 최악의 날과 이웃이다.
  3. 그래서 살아남는 유일한 길은 모델을 두 배로 의심하고, 폭락 중에 팔지 않으며, 레버리지를 두려워하는 것이다.

용어 미리보기

용어
정규분포 (Normal Distribution / Bell Curve) 평균을 중심으로 좌우 대칭인 종 모양 확률분포. 현대 금융 이론(포트폴리오 이론, Black-Scholes 옵션 모델, VaR)의 기초
표준편차 (σ, sigma) 데이터가 평균에서 얼마나 흩어져 있는지를 나타내는 단위. 정규분포 가정상 ±1σ 안에 68%, ±2σ 안에 95%, ±3σ 안에 99.7%의 데이터가 들어감
팻테일 (Fat Tails) 정규분포의 꼬리(극단값 영역)보다 훨씬 두꺼운 꼬리를 가진 분포. 극단적 사건이 모델 예측보다 훨씬 자주 발생
블랙스완 (Black Swan) Nassim Taleb가 대중화한 용어. 일어날 확률이 극히 낮다고 여겨졌으나 일어났을 때 충격이 큰 사건. 사후에 "당연했다"라고 합리화되는 특성
VaR (Value at Risk) "95% 신뢰구간에서 일일 최대 손실 X%" 형식의 리스크 지표. 2008년 이전 월가 표준이었으나 팻테일 사건에 무력함이 노출됨
변동성 클러스터링 (Volatility Clustering) 큰 변동이 일어나면 그 다음에도 큰 변동이 이어지는 경향. 최악의 날과 최고의 날이 같은 시기에 몰려 발생하는 이유
LTCM (Long-Term Capital Management) 노벨 경제학상 수상자 2명이 운용한 헤지펀드. 1998년 정규분포 모델이 "일어날 수 없다"고 한 사건이 일어나 46억 달러 손실, 글로벌 금융시스템을 위협
드로다운 (Drawdown) 자산 가치의 최고점 대비 하락폭. 살아남는 투자에서 가장 중요한 지표 중 하나

8거래일 동안 "수학적으로 불가능"이 일어났다

핵심: 지난 50년 모든 금융 재앙 직전에 누군가는 "이건 모델상 불가능하다"라고 말했다 — 그리고 매번 일어났다.

2020년 3월 9일부터 8거래일 동안 S&P 500은 매일 4시그마 이상 변동했다. -7.6%, +4.9%, -4.9%, -9.5%(1987년 이후 최악), +9.3%, -12.0%(서킷브레이커 발동), +6.0%, -5.2%.

정규분포(bell curve)에 따르면 4시그마 변동은 63년에 한 번 일어나야 한다. 8일 연속이라면 — 우주 나이(138억 년)보다 긴 시간을 기다려야 한다는 계산이 나온다. 수학은 정확하다. 모델이 틀렸다.

이 사건은 처음이 아니다.

  • 1987년 10월 19일 블랙먼데이 — S&P 500 -20.5%. 정규분포로는 약 20시그마 사건, 일어날 확률 10⁻⁸⁹ (소수점 아래 0이 89개). 비교: 관측 우주의 모든 원자 수가 약 10⁸⁰개. 우주의 모든 원자 중 1개를 무작위로 맞히는 것보다 일어나기 어려운 사건이 일어났다.
  • 1998년 LTCM 붕괴 — 노벨상 수상자가 운용한 헤지펀드. 모델이 "10시그마, 사실상 불가능"이라고 한 사건이 일어나 46억 달러 손실, 글로벌 금융시스템 위협.
  • 2008년 글로벌 금융위기 — 리먼 모델: "전국 주택 가격 동시 하락은 가능성 없음." 일어났다.

재앙은 모델이 "불가능"이라고 표시한 영역에서 정확히 발생한다.


왜 종형 곡선이 무너지는가 — 팻테일의 정체

핵심: 정규분포는 우아하고 계산이 깔끔해서 모든 금융 시스템이 쓴다. 다만 한 가지 문제가 있다 — 정확하지 않다.

자기는 정규분포를 쓴 적이 없다고 생각하는 독자가 많을 것이다. 그러나 자기 돈을 굴리는 시스템은 모두 정규분포를 쓴다. 증권사 앱의 리스크 지표, 로보 어드바이저의 자산 배분, 레버리지 ETF의 위험 모델 — 전부 종형 곡선이 기초다. "이런 폭락은 다시 안 올 거야"라는 직관적 안도감마저 종형 곡선식 사고다.

이론과 실제의 충돌

정규분포가 가정하는 건 일일 수익률의 종형 분포다. 이론대로면 다음과 같이 변동이 분포해야 한다.

σ 범위 정규분포 이론 실제 S&P 500 배율
3σ (~3.3% 변동) 연 1회 연 7~8회 10배
63년에 1회 수년에 1회 20배
7,000년에 1회 5~10년에 1회 약 1,000배
이론 vs 현실 — σ 변동 빈도 비교 (로그 스케일). 모든 단계에서 실제가 이론을 압도

분포 자체를 비교해 보면

가운데(평범한 날)는 종형 곡선과 비슷하다. 차이는 꼬리에서 폭발한다.

정규분포(파란 점선) vs 실제 시장(빨간 실선) — 가운데는 거의 같지만 꼬리는 압도적으로 다름

이 두꺼운 꼬리가 통계학자들이 말하는 팻테일(fat tails)이다. Nassim Taleb이 블랙스완에서 정리한 한 줄이 정확하다.

"종형 곡선은 큰 편차를 무시하고, 처리하지 못하면서, 우리가 불확실성을 길들였다고 착각하게 만든다." — Nassim Taleb

극단 사건은 일탈이 아니다. 시장이 작동하는 방식 자체에 내장된 특성이다.


팻테일이 만드는 세 가지 비대칭 — 모든 것을 뒤집는다

핵심: 팻테일은 단순히 "폭락이 더 자주 온다"는 의미가 아니다. 극단의 날들이 모든 것을 결정한다는 비대칭 구조를 만든다.

비대칭 ① — 5,000일 중 10일이 20년 수익을 결정한다

JP Morgan Guide to the Markets가 매년 발표하는 데이터가 팻테일의 비용을 가장 직관적으로 보여준다.

2003~2022년의 20년 동안 S&P 500에 1만 달러를 넣고 한 번도 손대지 않으면 6만 4,800달러가 된다(연 9.8%). 그런데 가장 좋았던 단 10일을 놓치면:

가장 좋은 N일을 놓쳤을 때 — 10일 놓치면 수익 절반 증발, 40일 놓치면 손실
시나리오 최종 자산 연 수익률
풀 보유 (5,000일 모두) $64,800 9.8%
최고 10일 누락 $29,700 5.6%
최고 20일 누락 $17,800 2.9%
최고 30일 누락 $11,700 0.8%
최고 40일 누락 $<10,000 (손실) < 0%

5,000 거래일 중 10일 — 0.2%의 날 — 이 누적 수익의 54%를 결정한다. 이게 마켓 타이밍이 통계적으로 위험한 본질적 이유다.

비대칭 ② — 최악의 날과 최고의 날은 이웃이다

여기서 비대칭은 더 잔인해진다. 변동성은 클러스터링한다. 최악의 날과 최고의 날은 같은 사이클 안에서 며칠 간격으로 함께 나타난다.

2008/2020 — 최악의 폭락 직후 곧바로 최대 반등이 따라왔다
  • 2008년 10월 13일: +11.6% (역대 최대급 단일 상승) → 불과 2일 후 10월 15일 -9.0%
  • 2020년 3월 16일: -12.0% (서킷브레이커 발동) → 다음 날 +6.0% 반등

VIX(공포 지수)가 2008년 89.5로 사상 최고치를 찍은 시기, 같은 주에 사상 최대급 상승과 폭락이 같이 나왔다. 우연이 아니라 구조적 현상이다.

이 비대칭이 만드는 결론은 명료하다.

폭락이 무서워서 팔면 거의 반드시 다음 반등도 놓친다. 그리고 그 반등 중 10일을 놓친 비용이 폭락을 견디는 비용보다 크다.

비대칭 ③ — VaR가 "95% 안전"이라고 말할 때, 5%에 파산이 산다

2008년 이전 월가의 표준 리스크 지표는 VaR(Value at Risk)였다. 전형적 진술은 안심을 준다.

"포트폴리오의 일일 최대 손실은 -3%, 95% 신뢰구간."

치명적 결함은 한 줄에 있다. 이 진술은 95%의 시간에 무슨 일이 일어나는지만 말한다. 나머지 5%에 대해서는 침묵한다. 팻테일 세계에서 그 5%가 바로 파산이 사는 영역이다.

LTCM이 정확히 그 함정에 빠졌다. 노벨 경제학상 수상자 Robert Merton과 Myron Scholes가 운용한 펀드. 정규분포 기반 모델이 모든 위험을 통제하고 있다고 믿었다. 1998년 러시아 디폴트로 자기네 모델이 "10시그마 — 사실상 불가능"이라고 한 사건이 일어났다. 펀드는 46억 달러를 잃고 글로벌 금융시스템을 위협했다.

리스크 모델이 "이런 일은 일어날 수 없다"고 말한다면, 그게 바로 가장 걱정해야 할 시점이다.


팻테일 세계에서 살아남는 4가지 규칙

핵심: 모델은 두 배로 의심하고, 폭락 중에 팔지 않으며, 레버리지를 두려워하라. 이 세 줄이 50년치 시장 사고에서 살아남는 길이다.

규칙 ① — "그런 일은 안 일어나"를 금지어로 등록한다

지난 50년 모든 금융 재앙 직전에 누군가는 정확히 이렇게 말했다.

사건 모델이 한 말
1987년 블랙먼데이 "이런 폭락은 모델상 불가능"
1998년 LTCM "10시그마는 일어날 수 없다"
2008년 글로벌 금융위기 "전국 주택 가격 동시 하락은 가능성 없다"
2020년 코로나 "8일 연속 4시그마는 수학적 불가능"

투자 가설이 "특정 극단 사건이 일어나지 않는다"에 의존한다면 그 가설은 모래 위에 지어진 것이다.

규칙 ② — 최악 시나리오를 두 배로 잡는다

모델 가정 vs 팻테일 현실 — 항상 두 배로 잡고 견디는지 확인

스프레드시트가 "최악 -20%"라고 답하면 실제 견딜 수 있어야 하는 건 -40%다. 종형 곡선은 -20% 일일 하락을 20시그마, 사실상 0% 확률로 본다. 그러나 1987년에 일어났다. 팻테일 현실에서는 항상 모델보다 두 배 가혹한 환경을 가정해야 한다.

규칙 ③ — Time IN market > Timing the market

이게 가장 실용적 결론이다. 비대칭 ①②에서 봤듯 20년 중 10일이 수익의 절반을 결정하고, 그 10일은 예측 불가능하며 최악의 날과 이웃이다. 결론적으로 신뢰할 수 있는 유일한 전략은 계속 시장에 있는 것이다.

마켓 타이밍에 관한 모든 학술 연구가 같은 결론에 도달한다. 최고의 날을 놓치는 비용 > 최악의 날을 피하는 이익. 두 날이 이웃이라 한쪽만 일관되게 피할 방법이 없기 때문이다.

적립식 투자(DCA, Dollar-Cost Averaging) — 시장 상황과 무관하게 정기적으로 같은 금액을 투자 — 가 팻테일에 친화적인 전략이다. 결정적인 극단의 날들이 왔을 때 항상 시장에 있게 된다.

규칙 ④ — 레버리지는 꼬리를 증폭시킨다

1×, 2×, 3× 레버리지에서 시장 -34% 하락 시 결과 — 3×는 전액 소실

정규분포 세계에서 2배 레버리지는 기대 수익을 두 배 늘리고 위험을 관리 가능한 수준으로 키운다. 팻테일 세계에서 레버리지는 다이너마이트다.

  • 2배 레버리지 + 시장 -20% = 자기자본 -40%
  • 2배 레버리지 + 시장 -10% (하루) = 자기자본 -20%
  • 3배 레버리지 + 시장 -34% = 자기자본 100% 소실 (전액 손실)

그리고 -34% 하락은 일어난다. 2020년 3월에 S&P 500이 단 23거래일 만에 -34% 떨어졌다. 레버리지는 회복 가능한 손실을 영구적 파산으로 바꿔놓는다.

투자 결정 전 한 줄 질문이면 충분하다.

"내 포트폴리오가 -40% drawdown을 견딜 수 있는가? 견딜 수 없다면 drawdown이 도착하기 전에 재구성한다."


한 줄로 끝내는 EP5

종형 곡선은 안전감을 준다. 팻테일은 현실이다. 5,000일 중 10일이 20년 수익을 결정하고, 그 10일은 예측 불가능하며 최악의 날과 이웃이다. "그런 일은 안 일어나"는 금융에서 가장 비싼 문장이다 — 1987년 전, 1998년 전, 2008년 전, 2020년 전에 모두 발화됐고 매번 일어났다.

세 줄로 정리하면:

  1. 모델이 "불가능"이라고 한 영역이 가장 위험한 영역이다 — 스트레스 테스트는 두 배로.
  2. 폭락 중에 팔면 다음 반등도 놓친다 — 시장에 머물러야 한다.
  3. 레버리지는 꼬리를 증폭시킨다 — 회복 가능한 손실을 영구 파산으로 만든다.

이 세 줄을 잊으면 50년치 시장 데이터가 가르친 교훈을 처음부터 다시 배워야 한다.


참고 문헌

  • Taleb, N. N. (2007). The Black Swan: The Impact of the Highly Improbable. Random House.
  • Mandelbrot, B., Hudson, R. L. (2004). The (Mis)behavior of Markets: A Fractal View of Risk, Ruin, and Reward. Basic Books.
  • J.P. Morgan Asset Management. (2024). Guide to the Markets — U.S. Edition (Q1 2024). "Time, diversification and the volatile nature of markets."
  • Lowenstein, R. (2000). When Genius Failed: The Rise and Fall of Long-Term Capital Management. Random House.
  • Sornette, D. (2003). Why Stock Markets Crash: Critical Events in Complex Financial Systems. Princeton University Press.
  • S&P Dow Jones Indices. Historical S&P 500 daily returns 1928–2024.

❓ 자주 묻는 질문

팻테일(fat tails)이 정확히 뭔가요?

통계적으로 극단값이 일어날 확률이 정규분포가 예측하는 것보다 훨씬 높은 분포를 말합니다. 시장 일일 수익률 분포는 가운데(평범한 날)는 정규분포와 비슷하지만 양 끝(폭락·폭등의 날)은 정규분포보다 훨씬 두꺼운 꼬리를 가집니다. 즉 "있을 수 없는 일"이 자주 일어납니다.

왜 정규분포로 시장을 모델링하면 안 되나요?

정규분포는 평균에서 멀어질수록 확률이 지수적으로 감소한다고 가정합니다. 그러나 실제 시장에서 4시그마(이론상 63년에 한 번)는 몇 년에 한 번 일어나고, 5시그마(이론상 7000년에 한 번)는 5~10년에 한 번 일어납니다. 1987년 블랙먼데이의 -20.5% 하락은 정규분포 가정상 10⁻⁸⁹의 확률 — 우주 나이보다 오래 기다려야 하는 사건인데 실제로 일어났습니다.

10일이 20년을 만든다"는 게 무슨 의미죠?

JP Morgan의 분석에 따르면 2003~2022년 20년간 S&P 500에 1만 달러를 넣고 가만히 두면 약 6.48만 달러가 됩니다(연 9.8%). 그런데 가장 좋았던 단 10일을 놓치면 2.97만 달러로 줄어듭니다(연 5.6%). 5천 거래일 중 단 0.2%의 날이 누적 수익의 절반 이상을 결정한다는 뜻입니다.

마켓 타이밍이 왜 위험하다고 하나요?

변동성이 클러스터링하기 때문입니다. 최악의 날과 최고의 날은 보통 같은 시기에 모여서 발생합니다(2008년 10월, 2020년 3월). 폭락이 무서워서 팔면 거의 반드시 다음 반등도 놓치게 됩니다. 그리고 그 반등 중 단 10일을 놓친 것만으로 20년 수익의 절반이 사라집니다.

평범한 개인 투자자도 팻테일을 신경써야 하나요?

직접 모델링은 안 해도 됩니다. 다만 세 가지는 기억하세요. (1) "그런 일은 안 일어나"라는 가정에 베팅하지 마세요(레버리지·옵션 매도). (2) -40% 이상의 drawdown을 견딜 수 있는 자산 배분을 유지하세요. (3) 폭락 중에 팔지 마세요 — 같은 사이클의 반등을 놓치는 비용이 폭락 자체보다 큽니다.

본 글은 제가 공부한 내용을 정리한 개인 의견 및 정보 제공 목적의 글이며, 특정 종목·상품에 대한 투자 자문이 아닙니다. 투자 판단과 책임은 본인에게 있습니다.