Skip to main content
分析

增量性测试:2025 终极指南

增量性测试对于了解您的广告投入是否带来了实际成果至关重要。或者,判断一个新的广告合作伙伴是否值得继续合作。以下是开始的步骤...

Content

Stay up to date on the latest happenings in digital marketing

博客增长归因

大多数营销人员都在广告上浪费资金,却没有意识到这一点。你的营销活动真的有效吗?还是说客户本来就会转化?在本文中,我们将探讨增量性测试——它是什么、如何入门,以及你需要提前应对的挑战。

读完本文后,你将学会如何衡量广告的真实影响力,优化预算,并基于数据驱动的洞察做出更明智的营销决策。

增量性测试:基础概念与主要类型解析

增量性测试用于衡量营销活动带来的真实效果。它可以让你比较测试组(接触广告)和对照组(未接触广告)之间的差异。其计算公式非常简单:

incrementality testing calculation

为了更好地理解增量性测试的流程,以下是其整体概览:

  1. 规划营销活动
  2. 确定目标受众或消费者
  3. 将其随机分为测试组和对照组
  4. 运行广告投放,仅向测试组展示广告,对照组不投放
  5. 观察两个群体的关键指标
  6. 计算广告的真实影响力

例如,假设你从事体育用品行业,销售高尔夫球车配件。你在 Facebook 移动端投放了一则关于高尔夫球车方向盘和座椅套件的广告活动。然后,你向一组高尔夫球车车主(测试组)展示广告,而另一组相似的车主(对照组)则不接触任何广告。

两周后:

  • 测试组:350笔购买
  • 对照组:280笔购买

使用公式,答案如下:

Incrementality Testing - Example With Formula

这意味着你的 Facebook 移动广告将销售额提高了 25%,证明你的营销活动确实激发了真实的需求。

这为什么重要?

  • 它通过展示哪些广告活动真正推动了新增收入,从而指导更好的预算分配
  • 它帮助你避免过度归功于广告平台,让你了解哪些销售本来就会发生,而不是广告推动的结果。
  • 它揭示了被低估的媒体渠道的潜在价值。例如,可能你的 Google 广告看起来带来了更多的转化,但增量性测试可能显示,实际上是 TikTok 或 YouTube 广告吸引了新客户,而不仅仅是重复购买的老客户。

为了更好地理解增量性测试,以下是它的不同类型:


A. 保留组测试

将你的受众分成测试组和对照组——测试组会看到你的广告,而对照组则不接触广告。这有助于提供洞察,了解某种营销干预(例如应用内广告或移动推送通知)是否真正改变了用户行为。

如果对照组的转化率与测试组相同,那么说明你的广告并没有推动真正的商业成果——你实际上是在为无效的广告投入资金。

什么时候使用它?

当你需要在增加广告支出之前获得明确的效果证明时,可以使用保留组测试。它非常适用于应用安装广告、应用内购买促销或移动再营销,特别是在测试新媒体渠道或调整营销组合时。

B. 基于地理位置的测试

基于地理位置的测试在特定的地理区域投放广告,而保持其他区域不展示广告。然后,你可以比较这些区域的表现数据来衡量增量性——如果销售或应用安装量仅在接触广告的区域有所上升,那么说明你的广告投放确实产生了影响。

为什么这很重要?

大多数移动营销策略依赖于用户跟踪,但隐私更新(如 iOS ATT)使得这种方法变得不可靠。基于地理位置的测试通过聚焦于区域而非单个用户,解决了这一问题。这样,即使在隐私限制较严格的环境下,你依然能够有效地衡量广告的影响。

什么时候使用它?

当你扩展到新地区或测试本地化广告活动时,可以使用基于地理位置的测试。例如,假设你经营一家本地服务型企业,比如位于芝加哥的窗户清洁公司,想要吸引更多的高楼客户。

在 Wicker Park 投放面向公寓业主的移动广告,但确保 Lincoln Park 没有广告。如果只有 Wicker Park 的预订量激增,那说明广告有效。但如果两个地区的请求量相似,说明您的广告没有带来新的需求。

C. 意向性治疗(ITT)测试

ITT 测试将用户分配到实验组和对照组,但与其他方法不同的是,某些对照组的用户仍然可能有机会自然看到广告。这反映了现实世界中的情况,有助于更准确地衡量广告的增量效果。

为什么会这样?

移动用户在多个平台上与广告互动,这使得严格控制广告曝光变得不现实。ITT 测试考虑了跨平台溢出效应——例如,分配到对照组的用户仍然可能在另一个特定渠道(如 TikTok)上看到您的广告。

这种方法通过反映广告在碎片化的数字空间中如何影响目标受众,防止了增量价值估计的膨胀。

什么时候使用它?

在进行多平台营销活动或测试高曝光量的移动广告时,使用ITT测试可以更准确地评估广告效果。

D. 基于时间的测试

基于时间的测试相对简单。

本质上,您启动一个新的营销活动或将一个新合作伙伴添加到您的营销组合中。重要的是,保持这是您广告和营销活动中唯一的重大变化(理想情况下也是唯一的小变化)。然后,您比较变化前、变化中和变化后的转化、下载、销售或其他相关指标的表现。

如果您看到业绩提升,而新营销活动是唯一的变化,那么这很可能是增量效应。

请注意,很多变化可能不属于您的营销组合,但仍可能影响您的增量测试:节假日、世界事件、天气事件、竞争对手的行动、应用商店算法变化等等。

E. 其他增量性方法

还有幽灵广告(ghost ads)、影子测试(shadow testing)和合成控制测试(synthetic control testing)。如果其他方法效果不佳,可以尝试这些方法。

现在,测量增量性。

如何避免不必要的麻烦来收集和编译营销数据?

使用 Singular 的营销分析工具,将所有移动营销数据汇总到一个易于阅读的报告中。清楚地了解广告费用的去向、用户在各设备上的互动情况,以及真正推动结果的因素。

marketing analytics tool

通过现成的报告和自动数据传输,您可以在无需翻阅电子表格或手动匹配数据源的情况下,衡量增量影响。

为了确保您的发现或解读始终准确,聘请一名数据分析师是一个明智的选择。他们可以帮助您发现可能遗漏的模式,清理杂乱的数据,并确保您的结果真正反映增量影响。

增量测试 101: 如何启动

遵循以下最佳实践来建立一个可靠的测试,衡量真实的影响,并确保您的营销投资带来实际的、数据支持的增长。

1. 设定明确的目标,以证明广告的实际影响。

如果没有明确的目标,增量测试就变成了猜测。你可能会发现转化率有所提升,但这是否意味着你的营销预算花得值得?还是说你的客户本来就会转化?

设定正确的目标,确保你的营销衡量重点放在真正的影响上,而不是误导性的虚荣指标。

该怎么做?

使用 SMART 框架:

SMART framework

假设你是一个资源网站,类似于专家主导的评审网站。

这是你的 SMART 目标的示例:

  • 确定Facebook移动广告是否能推动高端床垫的新联盟销售,通过在两个城市开展基于地理的增量性测试。通过使用联盟链接跟踪和Google Analytics,比较不同区域的转化率,衡量测试组在六周内的增量收入提升至少15%。

这怎么是聪明的?

SMART goal

以下是一些设定明确目标的更多提醒:

  • 如果您的广告跨多个渠道投放,请设定能够衡量每个平台独特贡献的目标,以避免误归因结果。
  • 如果增长最为重要,专注于客户获取。如果您想了解客户留存情况,可以通过衡量试验组的重复购买来评估。

2. 在没有外部因素干扰的情况下,衡量增量提升。

外部因素,如季节性变化,可能会扭曲您的结果,使广告活动看起来比实际效果更好。例如,假设在假日季节投放了高端耳机的移动广告,销售可能激增,但这些增长中有多少是由于广告效果,多少是由于假期购物趋势或像亚马逊这样第三方零售商的全站折扣呢?

如果不考虑季节性趋势和消费者行为的变化,您可能会高估增量效果,从而基于误导性数据做出预算决策。

该做什么

与历史数据进行对比,看看是否有类似的趋势在没有广告的情况下发生,这可以帮助您隔离广告活动的真实影响。此外,除非您同时在低需求时期进行对比测试,否则避免在主要促销季节启动增量性测试。

您还应该使用多个对照组。为此,您可以将受众分配到不同的地区或人群中,以便获得关于外部因素如何影响结果的有价值洞察。

假设您正在为睡眠跟踪应用程序投放移动广告。不要只使用一个对照组,而是按地区和生活方式划分受众:

  • 科罗拉多州的远程工作者
  • 纽约的忙碌专业人士

这有助于你了解工作安排或气候等外部因素是否会影响应用程序的采用,从而提供更准确的洞察。

此外,单独测试你的营销素材。为此,分别测试你的视频广告、数字内容和网红营销活动,以了解哪个渠道真正推动了转化。

3. 设置固定的测试周期,以避免追逐虚假的成功。

没有固定时间线进行增量性测试,就像在一次锻炼后检查你的健身进展——它不会告诉你太多。

如果你过早衡量结果,转化率的短期波动可能会误导你认为广告有效。如果等得太久,竞争对手的促销活动或季节性趋势等外部因素可能会扭曲你的结果。

与此同时,固定的测试周期可以防止短期广告热潮看起来像是真正的增长。它通过确保周末购物高峰、发薪日激增或突如其来的网红热度不会夸大结果,从而帮助计算增量性。

该做什么

将测试周期与客户购买周期相匹配。因此,如果你的产品有较长的决策过程,延长测试周期以捕捉延迟的转化。

例如,如果你经营的是类似在线吉他课程的服务型业务,大多数买家不会立即报名——他们会研究选择,观看免费课程,比较讲师后才做决定。因此,除了只测试一周外,应该将增量性测试的周期延长至至少30天,以捕捉那些来自认真学习者的延迟转化。

另一个设置固定测试周期的最佳实践是避免在重大营销活动期间进行测试。例如,如果你正在推出新产品或进行季节性促销,应该暂停测试,以防止结果被夸大。

你还应该回顾过去的营销活动效果趋势,以设定一个与自然客户行为相符的测试周期。最后,保持一致的时间框架以确保可比性。如果你进行的测试时间周期不一致,那么在不同活动之间比较结果时会变得更加困难。

4. 测试不同的移动应用用户细分群体

并非所有移动应用用户的行为都是一样的,针对所有用户进行单一测试可能会掩盖实际有效的因素。例如,新用户可能更容易对内容营销作出反应,而回归用户则通过重定向广告进行转化。

mobile app user segments

但是,通过测试不同的用户细分群体,你可以看到在客户旅程的每个阶段,哪个广告渠道能带来最大的增量影响。

该怎么做

根据用户行为进行细分。将用户分成不同的群体,比如首次访问者、活跃用户和不活跃用户。例如,如果你有一个健身应用,新用户可能会更倾向于参与免费试用活动,而长期用户可能对忠诚奖励反应更好。通过为每个细分群体单独测试广告策略,你可以避免在那些本来就会转化的用户身上浪费广告费用。

测试年龄特定的反应。年长用户与年轻用户的应用互动方式不同。例如,如果你在推广一款健康追踪应用,老年用户更容易对具有易读显示和简化导航的广告作出反应。

这一点尤为重要,因为 25% 的老年人存在视力障碍,这使得小字体和复杂界面变得难以操作。确保你的应用在广告中突出显示如大字体、高对比度颜色和语音辅助等功能,可以提高参与度,并推动这一细分群体的真实转化。

你还应该在客户旅程的不同阶段跟踪增量性。因此,针对刚安装应用的用户、已经使用一个月的用户和长期用户进行单独测试,以识别广告在哪个阶段产生最大的影响。

5. 在不同的移动平台上进行衡量

一则广告可能在 Android 平台上表现出高转化率,但如果 iOS 用户本来就会转化而无需广告,那么你的营销表现实际上并没有看起来那么强劲。

这是为什么?

因为增量性测试不仅仅是关于转化率,更是要证明广告是导致转化的原因。

如果一则广告在 Android 平台上显示出高转化率,但 iOS 用户——那些从未看到广告的用户——的转化率却相似,这就表明广告并没有真正推动需求。销售可能本来就会发生,这意味着你的营销表现被夸大了,实际上你花费在广告上的钱并没有带来真实的价值。

该怎么做

比较每个平台的营销渠道。例如,Facebook 或 TikTok 广告可能在 iOS 上驱动更多的增量转化,而 Google Ads 在 Android 上可能表现更好——分别进行测试。

此外,分析多触点归因,这是一种营销衡量方法,它为客户旅程中的每个接触点分配功劳,以显示不同渠道如何为转化做出贡献。

多触点归因(MTA)帮助你确定哪些接触点产生了最大影响,从而让你知道应该将营销预算集中在哪些地方,以获得最佳回报。

例如,如果你提供本地 SEO 服务,企业主可能会:

  • 看到你在 Facebook 上的移动广告(首次曝光)。
  • 在 Google 上搜索“最佳本地 SEO 机构”(互动)。
  • 点击你的 Google My Business(GMB)列表并拨打电话给你(转化)。

对于您的模型,您可以按如下方式分配信用:

attribution scores

一旦你识别出哪个平台带来了更多的真实增量转化,调整你的预算以最大化性能。

增量测试中的 3 个障碍(以及如何克服它们)

回顾您最新的广告活动,找出增量性测试可能存在的不足之处。现在解决这些问题,以获得准确的结果并优化您的预算。

A. 没有明确的移动用户行为基准

如果不了解用户在广告投放前通常是如何与您的应用互动的,就无法判断转化率的增加是来自于您的广告活动,还是只是正常的用户活动。例如,如果您的应用在某一周有自然的下载量激增,在没有正确基准的情况下进行测试,结果就可能被夸大。

在进行测试之前,以下是如何获得清晰基准的方法:

  • 在进行大规模投放之前,先在一个城市或特定受众群体中进行试点测试。
  • 将测试时间与正常活动周期匹配。不要仅在高流量季节进行测试。
  • 尽早定义处理组和对照组。投放广告前先对用户进行分组,以避免测试结果偏差。
  • 至少追踪用户数据 30 天。在进行任何测试之前,衡量应用安装、应用内操作和购买情况。

B. 移动端广告疲劳

广告疲劳是指用户看到同一广告过多次。当您的增量性测试运行时间过长或广告投放过于频繁时,用户可能会开始忽视或跳过广告,这会导致您的广告活动表现看起来比实际情况更差。

例如,如果一位移动用户每天看到您的广告五次,他们点击广告的可能性会急剧下降,这样您的结果可能会低估您广告活动的真实增量影响。

避免这种情况的方法如下:

  • 使用动态广告创意。根据用户行为个性化广告,避免重复的信息传递。
  • 限制每个用户的广告频率。设置单个用户在一天或一周内看到广告的次数上限。
  • 每两周更换一次广告创意。更换新的视觉效果、信息或格式,以保持高参与度。
  • 扩展到多种广告格式。测试视频广告、轮播广告和互动广告,保持新鲜感。

C. 移动广告活动重叠

如果您在测试 Facebook 广告活动的同时,还在运行 Google UAC 广告,您如何知道到底是哪一方在推动转化?重叠的广告活动会模糊结果,使得很难判断安装、购买或互动的增加是来自某个特定广告,还是多个广告的综合效果。

你可以通过以下方法避免这种情况:

  • 调整竞价策略以防止重叠,确保不同平台上的广告不会争夺相同的用户。
  • 跟踪启动日期,避免测试周期重叠。为此,可以规划所有当前和计划中的广告活动。
  • 在启动新测试之前,回顾过去的数据。从以往的重叠广告中汲取经验,以改进未来的广告活动规划。
  • 进行顺序测试,而不是同时进行测试。在加入新广告活动之前,先逐一测试每个变量。

结论

避免假设;测试一切。在增量性测试中,您可以验证营销效果而不夸大结果。与团队开会,找出测量方法中的薄弱环节。

您的处理组和对照组设置是否正确?是否考虑了外部因素?然后,回顾一下您可以首先应用的最佳实践。

但在这一切之前,确保您的数据是干净的。使用 Singular 将您的营销数据集中在一个地方进行收集和管理。现在预约演示,看看我们如何帮助您实现这一目标。

Stay up to date on the latest happenings in digital marketing

Simply send us your email and you’re in! We promise not to spam you.