목차
1. 개요
2. 베이지안 추론이란?
3. Meridian이 베이지안을 선택한 이유
4. Meiridian을 활용하기 위해 베이지안을 이해해야하는 이유
5. 마무리
1. 개요
이 전 글에서는 MMM과 Meridian이 무엇인지에 대해 알아봤다(👉🏻링크)
이번에는 Meridian의 핵심 추론 방식인 베이지안(Baysian) 접근법에 대해 다룬다.
많은 마케팅 모델들이 회귀 기반 방식이나 머신러닝 모델을 사용하는 것과 달리, Meridian은 왜 굳이 베이지안 추론을 택했을까?
그리고 Meridian을 활용하기 위해서는 베이지안을 어느정도까지 이해해야할지 확인해보려고 한다.(절대 내가 더 공부하기 싫어서 아님, 아무튼 아님)
2. 베이지안 추론이란?
베이지안 추론은 관측 데이터를 바탕으로 우리가 가진 사전 지식(prior)을 업데이트해 사후 분포(posterior)를 계산하는 통계적 추론 방법이다. 이 방식은 단순히 “정답을 예측”하는 데 그치지 않고, 결과의 불확실성까지 함께 제공한다는 점에서 매우 강점을 가진다.

| 용어 | 의미 |
| Prior | 관측 이전에 갖고 있는 사전 지식(ex.외계인이 있다고 믿는다) |
| Likelihood | 새롭게 관측된 데이터가 나타날 가능성(ex. 외계인이 우리집을 털었다) |
| Posterior | 관측 이후 업데이트 된 최종 추정치(ex. 우리집을 턴건 외계인이 아닌 도둑 사람이었다.) |
이 방식은 예측보다 추론(inference)에 강하며, 무엇보다 중요한 특징은 '불확실성을 수치로 계산할 수 있다는 점이다.
따라서 베이지안이 주목받는 이유는 다음과 같은 2가지로 정리될 수 있다.
- 기존의 모델은 하나의 수치만 제시하지만, 베이지안 모델은 '이 수치가 얼마나 신뢰할 수 있는지'까지 함께 제공된다
- 데이터가 부족하거나 노이즈가 많은 상황에서도 사전 지식 기반 추정을 통해 결과의 왜곡을 줄일 수 있다.
🔍 추가적으로 알면 좋은 개념들
1. 사후 예측 분포 (Posterior Predictive Distribution)
단순히 모델 파라미터의 추정에 그치지 않고, “향후 어떤 결과가 나올 확률이 높은가”까지 예측하는 분포.
- Meridian에서는 예산 시뮬레이션, ROI 예측, 광고 집행안 추천 등에 이 분포를 활용한다.
2. 계층적 베이지안 모델 (Hierarchical Bayesian Model)
Meridian은 단일 국가가 아니라, 서울/부산/광주 등 지역 단위(geo-level)로 모델링을 수행한다.
이럴 때 각 지역을 독립적으로 모델링하면 데이터가 부족한 지역에서 신뢰성이 떨어진다.
→ 계층 모델은 전체 평균(전국)을 기준으로 지역별 효과를 조정하며,
데이터가 적은 지역은 다른 지역 정보를 "빌려올 수 있는" 구조를 제공한다.
3. 베이지안 인과 추론
Meridian은 단순한 상관관계가 아니라 인과관계를 추정한다.
이를 위해 검색량, 계절성, 외부 변수 같은 혼동 요인(confounder)을 control 변수로 모델에 포함시켜
광고의 “진짜 효과”만 분리해서 추정할 수 있게 한다.
4. MCMC 샘플링 (Markov Chain Monte Carlo)
베이지안 추론은 대부분 수학적으로 직접 계산이 어렵다.
그래서 복잡한 분포에서 표본을 시뮬레이션으로 추출하는 기법이 필요하다.
Meridian은 그 중에서도 **NUTS (No-U-Turn Sampler)**라는 고급 알고리즘을 사용한다.
- 우리가 모델을 학습할 때 sample_posterior() 메서드를 쓰는 이유가 바로 이것이다.
👉🏻참고 자료
- https://blessedby-clt.tistory.com/85(글또의 슬지님 글인데 외계인 설명이 찰떡이라 잊혀지지가 않는다. 그만큼 설명이 훌륭!!!)
베이지안 통계 - 기본 개념 가볍게 살펴보기
들어가며통계학과를 졸업했지만 참으로 부끄럽게도 베이즈 통계를 제대로 공부하지 않아 어쩔 수 없이 역량의 부족으로 빈도주의자(frequentist)로 살아왔다. 빈도주의자든, 베이지안이든 어찌 됐
blessedby-clt.tistory.com
3. Meridian이 베이지안을 선택한 이유
Meridian은 베이지안 추론을 기반으로 MMM을 재설계한 프레임워크다.
베이지안 추론을 기반으로한 이유는 다음과 같다.
1. 마케팅 데이터는 불완전하고 노이즈가 많다
- 어떤 채널은 데이터가 많지만, 어떤 채널은 적다
- 일부 채널은 실험이 불가능하거나 예산이 매우 적어 모델링이 어렵다
- 하지만 실무에서는 이런 제약 속에서도 정확하고 신뢰할 수 있는 기여도 추정이 요구된다
→ 기존의 빈도주의 방식(단일 수치 예측)은 이런 불확실성을 다루는 데 한계가 있다.
2. prior(사전 지식)을 직접 반영할 수 있다
- 예를 들어, "Facebook 광고는 ROI가 평균적으로 3.0 정도다"라는 가정을 prior로 반영할 수 있다
- 이렇게 하면 데이터가 부족한 채널도 어느 정도 가이드를 가진 추정이 가능해진다.
3. posterior를 통해 신뢰구간 기반 판단이 가능하다
- 단일 수치가 아니라, 불확실성을 수치화한 신뢰구간 형태로 결과를 제공한다.
- 이는 실무자가 리스크를 감안한 전략 판단을 내릴 수 있게 해준다.
4.예측이 아닌 설명과 해석이 중심인 MMM에 적합하다
- MMM은 단순히 미래 수치를 맞추는 모델이 아니다
- 무엇이 KPI에 영향을 주었는가, 광고의 기여도는 어느정도인가 같은 '인과적 해석(inference)'이 핵심이다.
- 따라서 '왜 그런 결과가 나왔는가', '그 결과를 얼마나 신뢰할 수 있는가?'에 답해줄 수 있어야 한다.
5. confounder를 통제해 '진짜 광고 효과'만 분리 추정 가능하다
- 광고비와 KPI 간의 단순한 상관관계는 실제 광고 효과를 과대평가할 수 있다.
- 예를 들어 특정 시기에 검색량이 급증해 소비자 관심이 늘어난 경우 KPI상승은 광고 때문이 아니라 시장 수요 증가 때문일 수 있다
→ 이처럼 광고와 KPI 모두에 영향을 주는 confounder를 고려하지 않으면 모델은 광고의 기여도를 과도하게 주정할 수 있다
→ Meridian은 이런 confounder를 control 변수로 모델에 명시적으로 포함시켜, 광고의 순수한 인과적 영향력만 분리해서 추정할 수 있게 해준다
그렇다면 왜 이런 접근이 베이지안이어야 가능한가?
→ 빈도주의 기반의 전통 MMM은 모든 변수의 효과를 고정값으로 단순 추정학 때문에 사전 정보나 변수 간 불확실성, confounder 통제와 같은 복잡한 구조를 표현하기 어렵다
→ 반면 베이지안 모델은
- 각 변수의 효과를 확률 분포로 모델링하고
- prior를 통해 사전지식을 포함하며
- posterior를 통해 관측 데이터로 추정값을 업데이트한다.
- 또한 변수 간 상호작용이나 계층 구조도 유연하게 반영할 수 있다.
즉, 베이지안 방식은 "불확실한 현실의 마케팅 환경 속에서 제한된 데이터와 다양한 외부 요인을 고려해 정확하고 해석력 있는 기여도를 추정하는 데 최적화된 방식”이다.
우리가 알고 싶은 건 “이번 KPI는 왜 올라갔는가?”, “이 채널의 효과는 얼마나 신뢰할 수 있는가?”, “다음 예산은 어디에 어떻게 배분해야 하는가?” 같은 전략적 해석이다.
Meridian은 이러한 질문에 데이터 기반의 추론과 불확실성 정보로 답할 수 있는 실무 중심의 인과 해석 모델로 설계되었기 때문에,
베이지안 추론을 기반으로 하는 것이 합리적이라고 할 수 있다.
4. Meiridian을 활용하기 위해 베이지안을 이해해야하는 이유
Meridian은 베이지안 추론에 기반하고 있으므로, 이를 잘 활용하려면 몇 가지 개념은 반드시 이해하고 있어야 한다.
- 단순 수치로는 판단이 어렵다
- 예를 들어, 어떤 채널의 ROAS가 3.2로 나왔다고 하자.
그 자체로는 성과가 좋아 보인다. 하지만 신뢰구간이 [0.9, 5.7]이라면?
→ 이는 실제 성과가 낮을 가능성도 존재함을 의미한다. - 즉, 추정치 하나만 보고 판단하면 오판할 수 있다.
더보기
신뢰구간을 해석해보자(with GPT)
📌 신뢰구간이란? — 숫자 하나보다 “범위”로 말해주는 것
우리가 흔히 어떤 분석 결과를 보면
"이 채널의 ROAS는 3.2입니다."
이렇게 하나의 숫자로 결과가 나와요.그런데 생각해보면, 우리가 갖고 있는 데이터는 한정적이고 불완전하잖아요?
그런 데이터를 기반으로 예측한 숫자(3.2)는 사실 말 그대로 "추정치"일 뿐이에요.그래서 우리는 이 3.2라는 수치를 “얼마나 믿을 수 있는가?”,
즉, 실제 ROAS는 이 숫자 근처에 있을 확률이 얼마나 되는가? 를 알고 싶죠.이때 등장하는 게 바로 신뢰구간이에요.
🎯 예시로 이해해보자
"이 채널의 ROAS는 3.2이며, 90% 신뢰구간은 [0.9, 5.7]입니다."
이 말은 베이지안 관점에서는 이렇게 해석해요 👇
"현재 우리가 가진 데이터와 사전 정보에 따르면,
ROAS는 0.9에서 5.7 사이에 있을 확률이 90%입니다."즉, 3.2는 평균적인 추정값이고,
0.9~5.7은 그 값이 진짜일 수 있는 “범위”를 알려주는 것이에요.
🤔 왜 이런 정보가 중요한가?
단순히 ROAS가 3.2라고만 말하면, 이 숫자가 신뢰할만한지 아닌지 알 수 없어요.
- [3.1, 3.3] 같은 좁은 신뢰구간이면?
→ "오, 모델이 꽤 확신하고 있네!"
→ 실제로도 ROAS가 3.2 근처일 가능성이 높아요. - [0.9, 5.7] 같이 넓은 신뢰구간이면?
→ "음… 데이터가 부족하거나, 변동성이 크구나."
→ 낮은 효과일 가능성도 크다는 거예요.
💡 즉, 신뢰구간은 “그 수치를 얼마나 믿어도 되는지”를 보여주는 잣대예요.
🧠 Meridian은 왜 신뢰구간을 중요하게 다루나?
Meridian은 단순한 평균값만 보여주는 게 아니라,
항상 그 수치의 불확실성까지 함께 보여줍니다.왜냐면, 마케팅에서 의사결정을 할 땐 **“효과가 클지도 모르지만, 아닐 수도 있음”**을 고려해야 하니까요.
예산을 쏟아붓기 전에:
- 성과가 정말 좋을 가능성이 높은가?
- 아니면 운이 좋아서 수치만 높게 나온 건가?
이걸 판단하려면 신뢰구간을 봐야 하는 거죠.
📊 정리: 실무에서 신뢰구간 해석하는 법
평균 ROAS신뢰구간실무 해석3.2 [3.1, 3.3] 매우 신뢰 가능. 효과가 명확하고 안정적 3.2 [0.9, 5.7] 불확실성 큼. 조심해서 판단해야 함 3.2 [0.2, 8.0] 너무 불안정. 예산 투자 결정은 보류 필요 1.2 [0.9, 1.4] 낮지만 안정적. ROAS가 낮은 걸 확신할 수 있음
✨ 한 줄 요약
신뢰구간이란, 우리가 계산한 수치가 “얼마나 믿을 수 있는지”를 수치로 보여주는 방법이다.
평균값만 보고 결정하지 말고, 그 수치가 진짜일 수 있는 범위까지 함께 보자! - [3.1, 3.3] 같은 좁은 신뢰구간이면?
- 예를 들어, 어떤 채널의 ROAS가 3.2로 나왔다고 하자.
- 추정값은 '수치 + 불확실성'으로 해석해야 한다
- Meridian은 결과를 하나의 수치로 보여주는 것이 아니라, "이 수치가 얼마나 신뢰할 수 있는가"에 대한 정보까지 제공한다.
- 이를 해석하지 못하면
- 결과를 과대 해석하거나
- 신뢰성이 낮은 채널에 예산을 잘못 배분할 수 있다
- 실무자가 이해해야 할 최소한의 베이지안 개념
- Prior: 모델 학습 전에 주는 사전 정보 (예: Facebook = ROAS 3.0)
- Posterior: 데이터를 보고 업데이트된 예측값
- 신뢰구간: 추정값의 불확실성 범위 (예: 90% 확률로 이 범위 안에 있음)
'Study > ML&DL' 카테고리의 다른 글
| [Meridian 활용기] 3-2. Pre-modeling : 모델링 변수 조정과 튜닝 포인트 (0) | 2025.04.29 |
|---|---|
| [Meridian 활용기] 3-1. Pre-modeling: 데이터 구조 이해와 입력 설계하기 (1) | 2025.04.22 |
| [Meridian 활용기] 1. MMM과 Meridian은 무엇인가 (0) | 2025.04.18 |