본문 바로가기

Study/ML&DL

[Meridian 활용기] 1. MMM과 Meridian은 무엇인가

목차
1. 개요
2. MMM이란?
3. Meridian이란?

1. 개요

25년 1월 말 구글에서 새로운 MMM(Media Mix Model)을 출시했다.
이번에 구글에서 오픈소스로 모델인 Meridian을 출시함으로써 접근성이 높아졌다고 한다.

한 때 MMM이 많이 유행했다는데 나는 처음 알았다. 쩝...
아무튼 Meridian을 활용해야하는 일이 생겨서 그 활용기를 기록해보고자 한다.

 

+) TMI
대체 왜 모델명이 Meridian, 자오선인가에 대해 GPT한테 물어보니 아래와 같은 답변을 줬다.

" Google Meridian은 ‘광고 기여도라는 중심축(자오선)’을 기준으로, 다양한 변수의 혼란 속에서 정밀한 방향성을 제시해주는 MMM 모델이라는 점에서 이 이름이 붙은 것으로 보입니다." 

어디 한번 얼마나 제대로 된 기준을 제시할지 기가 막히게 활용해보자공


2. MMM이란?

Marketing Mix Modeling의 준말
다양한 마케팅 활동이 매출이나 KPI에 미치는 영향을 통계적으로 분석하는 방법론
  • 목적
    • 각 마케팅 채널(ex. TV, 디지털, 오프라인 등)의 기여도를 정량적으로 측정해 예산 배분과 전략 수립에 활용한다
  • 분석 방식
    • 과거의 시계열 데이터를 바탕으로 회귀 분석 등 통계 기법을 사용
    • 매출을 기본판매와 증분 판매로 분류
      • 기본판매 : 광고 없이 발생하는 자연 매출 (Organic input)
      • 증분판매 : 마케팅 활동으로 인한 추가 매출 (Incremental Applications of input)
  • 활용
    • ROI(Return Of Investment), 광고 탄력성, 채널 별 기여도, 시뮬레이션 분석 등
  • 결과물
    • 각 마케팅 요소의 매출 기여도, 연도 별 변화, 예산 최적화 시나리오, KPI 별 영향력 등

3. Meridian이란?

Google Meridian은 MMM을 구현하기 위한 오픈소스 프레임워크
최신 데이터 환경과 마케팅 현실에 맞게 MMM을 한단계 업그레이드한 도구

이와 관련된 Meridian의 모델링은 다음과 같은 특징을 갖고 있다.

  1. 베이지안 추론 기반의 모델링
    • 과거의 지식(prior)과 새롭게 관측된 데이터(posterior)를 결합해 마케팅 채널의 성과를 추정한다
    • 광고 채널의 효과가 얼마나 불확실한지(신뢰 구간)까지 알려준다는 점에서, 
      데이터가 부족하거나 실험이 불가능한 상황에서 리스크를 통제하며 판단할 수 있는 강력한 도구
  2. 지역 단위의 성과 분석
    • 단일 국가 단위 분석이 아니라, 서울/부산/광주 등 지역 별 데이터 특성을 반영
    • 특정 지역의 광고 예산 집행 전략을 정교하게 수립
  3. 검색 쿼리량을 **confounder로 반영
    • Meridian은 검색량(ex.BHC 치킨)이 KPI에 영향을 줄 수 있는 혼동요인(confounder)임을 인식하고 이를 반영
      (**confounder : 광고비(원인변수)와 KPI(결과변수)에 모두 영향을 주는 제 3의 변수. 이 변수를 모델에서 통제하지 않으면, 광고 효과가 과대 추정될 수 있음)
    • 예를 들어
      • 소비자들의 관심이 높아져 자연스럽게 검색량이 증가하고,
      • 그에 따라 가입도 증가했는데
      • 이걸 MMM이 광고 효과로 착각하게 될 수 있음
    • 그래서 Meridian은 검색량을 control 변수로 포함 시켜, 광고가 아닌 시장 수요의 자연 증가분은 따로 분리하고 광고의 진짜 효과만 추정할 수 있도록함
  4.  ROI에 대한 prior 지식 반영 가능
    • Meridian의 강점 중 하나이다.
      각 광고 채널의 ROI(투자 대비 수익률)에 대해 우리가 갖고 있는 사전 지식(prior)를 모델에 직접 반영할 수 있다는 것.
    • 예를 들어
      • Facebook 광고는 과거 MMM이나 실험 결과에서 ROAS(광고비 대비 매출)가 약 3.0 수준으로 나옴
      • 하지만 지금은 데이터가 부족해서, 모델이 안정적인 추정을 하기 어려움(신규 채널 or 예산이 적은 경)
      • 이럴 때 Meridian에서는 사전 지식(prior)을 넣을 수 있음
        즉, LogNormal(3.0, 0.5)는 "보통 이 정도 효과일거야"라고 모델에 힌트를 주는 역할을 하는 것
    • 사전에 보유한 실험 결과나 업계 지식을 모델에 반영함으로써, 단순한 데이터 기반 추정이 아닌 '설계 가능한 모델링'이 가능해지고, 그만큼 예측 결과에 대한 신뢰도도 높아진다
# ROI에 대한 prior 분포 입력 (예: 평균 3.0, 분산 0.5)
roi_priors = {
  "Facebook": (3.0, 0.5)
}

+) 구글 문서와 관련된 해외 블로그 글을 읽다보면 ROAS와 ROI 개념이 혼재되어 있다.
Meridian의 roi_priors(파라미터명)는 실제론 ROAS(광고비 기준 수익) 개념에 가깝게 작동하지만, 모델에서는 ROI라는 표현으로 포괄적으로 사용됨


3, 4번 특징을 이해하는데 꽤 어려웠다.
다시 한번 풀어보자면 Meridian은 검색량이 원인 변수와 결과 변수 모두에 영향을 줄 수 있기 때문에
검색량을 통제 변수로 인식하고 모델에 포함한다는 의미이다. 

또한 우리가 갖고 있는 사전 정보를 모델링에 활용할 수 있다는 점에서 모델의 결과값(추정값)을 더욱 신뢰할 수 있다. 

** 헷갈리는 용어 정리

원인 변수
(원인 or 설명 변수)
KPI에 직접적인 영향을 주는 요인 광고비, 노출수, 예산
결과 변수 (종속 변수) 우리가 예측하고자 하는 값 가입 수, 매출, 전환 수
통제 변수
(혼동 변수 / 외부 변수)
원인과 결과 모두에 영향을 주는 외부 요인
→ 분석에서 혼란을 유발할 수 있음
특정 키워드 검색량, 계절성, 경제 상황