본문 바로가기

Study/ML&DL

[Meridian 활용기] 3-2. Pre-modeling : 모델링 변수 조정과 튜닝 포인트

목차
1. 개요
2. 모델링 전 확인해야 할 기본 설정
3. 모델링 단계벌 조정 포인트

    3-1. 포화(saturation) 효과 해석 및 튜닝
    3-2. 광고 효과 지현(Lagged Effect) 해석 및 튜닝
    3-3. 채널 별 기여도 해석과 후처리

4. 마무리

1. 개요

이전 글에서는 Meridian의 데이터 입력 구조를 정리했다.
이번 글에서는 모델링 과정에서 조정할 수 있는 주요 변수들과 그 의미를 살펴보려 한다. Meridian은 오픈소스지만, 기본 설정 그대로 돌린다고해서 최적의 결과가 나오지는 않는다. 따라서 활용하는 데이터 set의 구성과 도메인에 맞춰 튜닝하는 과정을 살펴보려한다.


2. 모델링 전 확인해야 할 기본 설정

구글에서 제공하는 기본 meridian 실행 코드에 따라 작성한 내용이며, 기본적으로 설정해야할 내용은 4가지이다.

Step 1 : Load the Data

  1. KPI 유형 설정
    • 매출 기반 모델인지, 전환 수 기반 모델인지 명확히 설정한다
    • kpi_type = 'revenue' 또는 'conversion'
  2. 광고 채널 매핑
    • 미디어 지출 데이터(media_spend)와 노출 데이터(impression)를 채널별로 매핑한다.
    • ex. facebook_spend -> Facebook 채널, search_spend -> Search 채널
  3. 컨트롤 변수 포함 여부
    • KPI와 광고비 모두에 영향을 줄 수 있는 외부 요인(ex. 검색량 GQV)를 통제 변수로 추가할지 결정한다.

Step 2 : Configure the model 

  1. prior 설정 여부
    • 채널 별 ROI, ROAS에 대한 사전 지식(prior)이 있다면 반영할지 결정한다.
    • ex. Facebook 광고는 평균 ROAS 3.0정도 -> LogNormal(3.0, 0.5)

3. 모델링 단계별 조정 포인트

Meridian은 기본적으로 포화 효과(Saturation)과 지연 효과(Lagged Effect)를 모델링한다.
하지만 결과 해석과 튜닝은 사용자가 해야한다. 아래 내용은 주요 조정 포인트이다.

3-1. 포화(Saturation) 효과 해석 및 튜닝(gamma_m)

  • 의미 : 광고 지출이 증가할 수록 매출 증가 폭이 둔화되는 현상(경제학에서 말하는 '수확 체감 법칙')
  • Meridian의 기본 처리 : Hill함수 기반 포화 모델링 자동 적용
    • Hill함수?
      • 출처 : https://towardsdatascience.com/carryover-and-shape-effects-in-media-mix-modeling-paper-review-fd699b509e2d/
         
      • 입력값(광고 지출)이 커질 수록 출력값(매출 증가)이 느려지는 형태를 가진 함수이다.
      • 약간의 광고 지출 증가는 빠른 반응을 만들지만, 일정 수준을 넘으면 광고 효과가 점차 포화되어 추가 지출의 효과가 줄어든다.
      • S자형태(sigmoid)에 가까운 곡선이다.
  • 우리가 해야할 것
    • 채널 별 gamma값(포화 곡선의 기울기)을 해석
    • 지나치게 포화가 빠르게 오는 채널(=효율이 급격히 떨어지는 채널)을 식별
    • 필요시 prior로 gamma를 수정 (ex.LogNornal로 약한 포화 형태 가정)
  • 주의사항
    • 포화값이 너무 높거나 낮으면 비즈니스 직관과 어긋날 수 있다.
    • 예를들어, 검색광고는 포화가 느리게 와야 하고, TVC는 빠르게 오는 경향이 있음

 

3-2. 광고 효과 지연(Lagged Effect) 해석 및 튜닝

  • 의미 : 광고비 지출 이후 효과가 시간차를 두고 나타나는 현상. (ex. TV 광고를 본 직후가 아니라 며칠 뒤에 구매로 이어질 수 있음)
  • Meridian의 기본 처리 : Adstock 함수 기반 지연 효과 모델링을 자동 적용한다.(adstock_rate 또는 alpha_m 이라는 지표로 표현)
    • Adstock 모델이란?
      • 출처 : https://thinktv.ca/research/adstock/
         
      • 광고의 잔존 효과를 수학적으로 표현하는 모델이다.
      • 한번의 광고 노출이 시간이 지남에 따라 점진적으로 사라지는 패턴을 설명한다.
      • Adstock Rate(=alpha_m)는 매회 전환율에 얼마나 잔존 효과가 반영되는지를 나타낸다.
      • alpha_m은 매체 단위로 처리된다.
        즉, 매체별로 "얼마나 광고 효과가 오래 지속되는지"를 따로 추정한다.
  • 우리가 해야하는 것
    • 채널 별 alpha_m값을 확인한다.
    • 광고 효과가 바로 반응하는 채널(검색, 퍼포먼스 매체)과 효과가 지연되어 나타나는 채널(TVC, 브랜딩 캠페인)을 구분한다.'
  • 주의사항
    • 실제 비즈니스 특성과 광고 소재 특성을 반영해야 한다.
    • 브랜딩 중심 캠페인은 높은 adstock, 퍼포먼스 캠페인은 낮은 adstock이 일반적이다.

 

3-3. 채널 별 기여도 해석과 후처리

  • 의미 : 모델이 추정한 채널별 효과를 기반으로, 실제 예산 최적화와 KPI 분석에 활용하는 단계
  • 우리가 해야하는 것
    • 채널별 ROAS 또는 탄력성 값을 검토
    • 신뢰구간을 함께 해석해, 추정값의 불확실성 반영
    • 이상치(이상 고효율 채널)나 극단적 결과는 후처리로 조정할 수 있음

👉🏻참고자료

더보기

4. 마무리

이번 글에서는 Meridian 모델링 과정에서 조정해야 할 핵심 변수들을 정리했다.
다음 글에서는 모델링 결과를 어떻게 해석하고, 예산 최적화에 활용할 수 있을지 살펴볼 예정이다.