展博增长实验室# 面向出海游戏 Studio 和增长团队,提供 UA 买量诊断、发行/投放平台建设、A/B 实验与 AI Agent 增长系统咨询 。
我关注的不是再做一个 dashboard,而是帮助团队回答三个问题:
现在的 ROI、CPI、ROAS、LTV 到底准不准? 钱浪费在哪里,扩量机会在哪里? 团队能否把优化师经验沉淀成可复跑的增长系统? 我能提供什么# UA Growth Data Diagnostic :从媒体后台、MMP、SDK 事件、BI 聚合四条链路诊断买量增长问题。发行/投放平台建设咨询 :从统一数据底座、ROI360 看板、素材管理、批量创编到策略引擎和 Ad Agent。A/B 实验与增长测量体系 :流量分层、实验管理、统计分析引擎、指标体系与 Agent-ready Measurement。查看服务 · 查看案例 · 关于我
适合谁# 月消耗已经达到一定规模,但 ROI 波动、数据口径争议大的出海游戏团队 UA 团队 2–10 人,优化师仍依赖多个后台和经验做日常决策 已经有 BI 或 MMP,但缺少统一指标口径、归因链路和策略复盘机制的团队 准备从「人肉看数 + 手工操作」升级到「数据驱动 + AI 辅助决策」的增长团队 方法论# 层级 关键问题 典型交付 数据可信 数据准不准 数据链路诊断、指标口径、归因对账 买量效率 钱花得好不好 Campaign 结构、预算分配、素材生命周期分析 决策系统 团队如何做决策 ROI360、红绿看板、异常预警、Action Tracking 策略自动化 经验如何沉淀 规则引擎、策略模板、UA Monitor / Ad Agent
公开文章# 我会持续把出海买量、实验平台、数据产品和 AI Agent 增长系统的研究整理成文章。你可以从 文章 开始阅读。
增长不是一次灵感,也不是某个爆款素材、某个新渠道、某个产品改版带来的偶然结果。
真正可持续的增长,来自一套能够不断提出假设、验证假设、沉淀结论、再继续迭代的实验体系(贝叶斯方法)。
我想用一句话概括这个观点:实验即增长。 这也是展博增长实验室推出的产品(实验&增长咨询服务,面向内容、电商、游戏等行业提供实验&增长的诊断、咨询、平台建设、业务陪跑等服务)。
尤其在出海游戏行业,这句话更接近现实。因为出海游戏面对的是高度不确定的市场:不同国家、不同文化、不同平台、不同买量环境、不同用户付费习惯,都可能让同一个产品表现出完全不同的增长曲线。
在这种环境下,企业不能只依赖经验判断,而要依赖实验。
一、为什么说“实验”是增长的基础? 科学的基础不是“我觉得”,而是“可论证”。
从证据可信度来看,我们可以看到一个从低到高的金字塔:案例研究、观察研究、类实验、随机控制实验,以及更高层级的统合分析。
这些方法形式不同,但本质上都在回答同一个问题:
某个变化,是否真的带来了结果?
在商业增长里,这个问题尤其关键。
比如:
留存提升,是因为新手引导改得更好,还是因为这批用户质量本来更高? ROI 提升,是因为素材策略有效,还是因为渠道算法短期波动? 付费率提升,是因为礼包设计更合理,还是因为活动期间用户天然更愿意付费? 如果没有实验体系,团队很容易把相关性误判为因果关系,把短期波动误判为方法论,把偶然成功误判为可复制能力。
所以,增长团队真正需要的不是更多“拍脑袋的优化建议”,而是一套持续验证因果关系的机制。
二、为什么增长离不开实验? 增长是所有商业组织前进的动力。
但增长本身不是一个单点问题,而是一组连续问题:
如何让更多用户看到产品? 如何让用户愿意下载或进入游戏? 如何让用户留下来? 如何让用户持续活跃? 如何让用户付费? 如何让 LTV 高于获客成本? 这些问题之间相互关联,任何一个环节的改动,都可能影响整体增长效率。
在出海游戏里,增长链路尤其长:从素材、广告、商店页、下载、首日体验、新手引导、核心循环、活动运营、付费设计,到广告变现和再营销,每一步都有优化空间。
这也是为什么我认为:
增长不是找到一个答案,而是建立一套不断找到答案的系统。
这个系统的核心,就是实验。
三、出海游戏公司的四类典型实验场景 如果把出海游戏公司的增长拆开看,实验至少会发生在四个关键场景里:用户体验、产品特性、买量与营销效率、商业化收益。
1. 用户体验实验:优化玩家进入游戏后的第一感受 用户体验实验关注的是:用户是否愿意继续玩下去。
常见实验包括:
新手引导流程调整 首局难度设计 UI 布局优化 任务系统节奏 奖励反馈强度 核心玩法教学方式 衡量指标通常包括:
游戏时长 次日留存、七日留存 对局数 关卡完成率 GMV 或早期付费转化 用户流失节点 例如,一个休闲游戏可能会测试两种新手引导:一种是强引导,明确告诉用户每一步怎么操作;另一种是弱引导,让用户更快进入核心玩法。
表面上看,强引导更“清楚”;但实验结果可能显示,弱引导让用户更快获得乐趣,反而提升了留存。
这就是实验的价值:它能帮助团队摆脱主观偏好,回到用户真实行为。
2. 产品特性实验:探索产品该往哪里发展 产品特性实验关注的是:产品是否真正解决了用户需求。
常见实验包括:
新玩法模块 社交系统 排行榜 活动机制 关卡类型 道具系统 个性化内容推荐 这类实验不只是验证“功能有没有用”,更重要的是帮助团队判断产品方向。
...
钛动科技递表港交所,82% 毛利率、38 亿应收账款、代投占绝大部分收入。这套模型在 Agentic UA 时代还站得住脚吗?
作者:展博 / 2026-07-04
tl;dr 82% 毛利率不是 AI 溢价,是会计口径:钛动的毛利率不能对标 Salesforce,它用净额法把媒体成本从营收里扣掉,剩下的"服务费"计为营收。研发投入占比不到 10%,员工里大量是优化师,本质仍是高杠杆的代投公司。 代理生态是媒体让渡的生存空间:Meta / Google / TikTok 给到代理商的返点、垫资额度、独家版位,是媒体在特定阶段的"分销红利"。这个空间正在被 Agentic UA 一步步收回。 代投模式会被 PMax / Advantage+ / Smart+ 逐级替代:广告主只需要给"预算 + 创意 + 转化信号",campaign 结构、出价、版位、受众全交给媒体算法。代投团队"搭 campaign / 调出价"的核心工作量,正在归零。 国内买家的 SaaS 接受度天然低:数据无法联通、inhouse 数据不外流、决策链条深、ROI 无法证明——TTD 那套海外投放平台生态在国内跑不通,钛动/GatherOne/飞书深诺的 SaaS 收入占比大概率不到 10%。 inhouse 自建才是国内出海买量的终局:数据自主 + ROI 预估模型 + 跨媒体灵活路由,这三件事只能自己做。代投+SaaS 双轮驱动的故事,写在招股书里好看,但打不过一个中等规模品牌自建的发行平台。 一、先拆一下钛动这张财报 钛动 2026 年 2 月递表港交所,中金 + 摩根大通保荐。招股书里最抓眼球的数字是82% 毛利率。
媒体报道基本都把这个数字包装成"AI 技术溢价、高技术壁垒"。做过发行、做过代投的都知道这里有猫腻。
1.1 82% 毛利率是怎么算出来的 代投这个生意,客户付 $100 广告预算,你替他打给 Meta 花掉 $90,再赚一点服务费或返点。传统代理会把 $100 计成收入、$90 计成成本,毛利率 10%。
...
同样在做 AB 测试,别人靠它持续迭代、增长一路向上,我们的实验却结果不可靠、推全就反转。问题往往不在平台,而在你没建之前就该想清楚的那几件事。
作者:展博 / 2026-06-22
tl;dr 竞对靠实验跑赢了,你也想做,但「实验结果不可靠、推全后效果反转、不知道该信哪个指标」——这些不是平台不够强,是实验体系没建对。 实验时涨、推全后反转,最常见的原因有三个:偷看数据提前停、只挑显著指标报、没看护栏指标。这三个坑和平台贵不贵没关系。 判断一个提升是否可信,不能只看 p<0.05,还要看效应量、护栏指标有没有掉、长期效应是否成立。 80% 的实验平台问题不是技术问题,是指标口径、流程、组织问题。 你以为缺的是工具,其实缺的是共识。 建平台之前,先花半天做个体检。 决策前花小钱搞清楚「值不值得建、该怎么建」,比拍脑袋投几十万、再发现方向错了,便宜太多。 一、你可能正被这几个问题困住 先不谈平台、不谈架构。我想先问你几个问题——如果你是增长、产品或者数据负责人,看看下面这些是不是你正在经历的:
「竞对靠实验跑出来了,我们也想做实验,但不知道从哪儿下手。」 看到对手用 AB 测试快速迭代、增长曲线一路上扬,你也想复制这套打法,可一落到自己团队,连「第一个实验该怎么设计」都说不清楚。
「我们的实验平台,结果好像不太可靠。」 平台是有了,可同一个实验,不同人看出来的结论不一样;今天说显著,明天又说不显著。你心里其实没底——这些数到底能不能信?
「实验时看着涨,推全之后效果反转,或者根本没达到预期。」 这是最让人崩溃的一种。实验阶段明明指标涨了,信心满满全量上线,结果线上效果反转,甚至还不如不改。那当初那个「提升」,到底是真的,还是数据骗了你?
「到底该看哪些指标?怎么判断一个提升是不是可信?」 一个实验看十几个指标,挑一个涨的报上去,算不算成功?p 值小于 0.05 就一定靠谱吗?留存没动、付费涨了,能推全吗?
「说到底——我们的实验平台,建得到底对不对?」 花了钱、花了人,可越用越怀疑:是不是从一开始方向就错了?
如果这些问题你中了一半以上,那我可以负责任地说:这些大概率不是「平台不够强」的问题,而是「实验体系没建对」的问题。 而后者,加再多机器、买再贵的 SaaS 也解决不了。
下面我们一个一个拆。
二、一个真实的场景:平台建好了,然后呢? 先说一个我反复见到的场景,它正是上面那些问题的总和。
一家公司,老板拍板「我们要数据驱动」,于是数据团队花了三个月,搭了一个看起来很专业的实验平台:能分流、能看报表、能跑 AB。
然后呢?
产品团队觉得「这玩意儿太麻烦,我直接上线不行吗」; 增长团队自己有一套买量看数的逻辑,不鸟这个平台; 数据团队辛辛苦苦建的东西,三个月后没人用,结论也没人信。 钱花了,平台有了,但增长没变快。
这不是个例。根据我的观察,有实验平台的团队里,大概 80% 都卡在「建了但没人用」这个状态。
更要命的是,这个坑很贵——你不是损失了搭平台的几十万,你损失的是「本可以用来验证增长假设的几个月时间」。
三、为什么会这样?因为大部分问题,根本不是技术问题 很多团队一想到「实验能力不行」,第一反应是「我们的工具不行,得建个更好的平台」。
这是最常见的误判。
先说结论:实验体系的问题,可以拆成四层,技术只是最浅的一层。
阻力层 典型表现 真相 工具层 「我们没有实验平台」「分流都做不了」 这是最容易解决的,花钱花人就能搞定 流程层 「实验做完就忘了」「没人写假设」「结论存哪了?」 工具再好,流程不通照样白搭 组织层 「数据团队建平台,产品团队不用,增长团队自己玩」 三权不清,谁都不为实验结果负责 文化层 「老板拍板,实验数据不算数」「失败的实验没人敢说」 最深的一层,建再好的平台也救不了 这里最关键的是:很多你以为的「技术问题」,其实是流程或组织问题。
...
展博增长实验室方法论:实验即增长
关键词:产品增长、买量增长、商业化增长、系统构建
很多准备出海做休闲游戏的小 studio,最容易犯的错误,是把增长理解成「买量」。
产品上线,接 SDK,开广告账户,投 Meta、Google、TikTok,看 CPI 和 ROAS。数据不好,就换素材、换国家、换出价;再不好,就归因于「产品不行」或者「现在买量太贵」。
这个判断不完全错,但它太粗。
真正的问题通常不是「有没有买量」,而是:
你有没有一套能让产品、买量、商业化持续互相校准的增长系统。
对小团队来说,增长不是一个部门,也不是一个岗位,而是一套实验体系。产品实验提高留存,商业化实验提高 ARPU,买量实验验证规模化可能。三者合在一起,才构成休闲游戏出海的增长闭环。
这就是展博增长实验室的第一个实操方法论:
三元增长模型:产品 × 买量 × 商业化。
一、小 studio 为什么不能只谈买量? 休闲游戏出海看起来门槛低:玩法轻、开发快、IAA 变现路径清晰、全球市场可测试、买量平台也成熟。
但真正跑起来后,小团队通常会卡在三个地方:
买来的用户留不住
CPI 看起来还能接受,但 D1、D7 留存不达标。预算越放大,亏损越明显。
有 DAU,但广告收入撑不起买量
用户愿意玩,但广告 ARPU、eCPM、填充率、展示频次没有被系统优化,看起来有流量,实际 LTV 不够。
有局部收入,但不知道怎么放大
某些国家、素材、渠道跑得不错,但团队不知道结果来自哪里。预算一放大,ROAS 就掉。
所以,小 studio 的增长起点,不应该是「我要不要加预算」,而应该是:
我有没有能力用实验不断回答三个问题:用户为什么留下来?用户能贡献多少钱?什么样的用户值得买?
二、三元增长模型:产品、买量、商业化是一套闭环 对休闲游戏来说,增长可以拆成三个引擎。
增长引擎 核心问题 关键指标 产品增长 用户为什么愿意继续玩? D1/D7/D30 留存、时长、关卡通过率 买量增长 什么用户可以被稳定买进来? CPI、ROAS、LTV/CAC、素材转化率 商业化增长 每个用户能产生多少收入? 广告 ARPU、广告 LTV、eCPM、填充率 很多团队的问题,是把这三件事分开看:产品只看玩法,买量只看 CPI,商业化只看广告收入。
但真实增长里,它们是互相决定的:
产品留存决定 LTV 上限 LTV 上限决定可承受 CPI 买量带来的用户结构影响留存和广告 ARPU 广告策略过重会损伤留存,最终降低 LTV 商业化收入反过来决定买量预算和放大空间 所以三元增长模型的核心不是「三个模块都要做」,而是:
...
从 Meta 广告平台的 20 年演进,看 Marketing API 为什么从 v1 一路走到 v25,以及广告主侧的 Ad Agent 为什么会越来越重要。
tl;dr Meta 广告系统的演进,不是一条简单的"广告后台功能越来越多"的产品线,而是一条更清晰的主线:从人工投放,到算法托管,再到 Agentic execution,工具->平台->操作系统的迁移路线很清晰。
Marketing API 的版本迭代也不是纯技术问题。v1 到 v25 的变化,本质是 Meta 把广告系统的控制权,从广告主和第三方工具手里,逐步迁移到自己的算法和自动化系统里。
这件事对广告主很关键:未来不是工具层的"谁更会点后台",也不是平台层的"做聚合投放",而是谁能搭建一个本地的、跨平台的、可审计的 Ad Agent,把 Meta / Google / TikTok 的自动化能力策略性地聚合到自己的增长操作系统里。
一、Meta 商业化的 20 年:广告平台如何从工具变成操作系统 先说结论:Meta 商业化的历史,就是广告主控制权不断让渡给平台算法的历史。
早期 Facebook Ads 是一个广告工具。你选人群、选版位、写素材、设预算,平台负责把广告投出去。
今天的 Meta Ads 更像一个黑盒增长系统。广告主提供目标、素材、预算、转化信号,剩下的受众匹配、版位组合、预算分配、创意组合,越来越多由系统自动完成。
可以粗略分成五个阶段。
阶段 1:社交广告的诞生——把"人"变成广告库存 Facebook 广告的第一阶段,是把社交关系和用户画像商业化。
传统展示广告卖的是页面位置。Facebook 卖的是人:年龄、性别、兴趣、关系、行为。
这带来一个根本变化:广告投放从"买媒体位置"变成"买用户匹配"。
传统 display ads: 广告主 → 买网站/频道/版位 → 触达用户 Facebook Ads: 广告主 → 定义人群/目标 → 系统匹配用户 这个阶段的核心能力是 targeting。
...
2026 年 5 月
作者:展博
引言:为什么最强的模型,交付效果却不如人意? 2026 年,AI Agent 已经不是新鲜词。
企业 CTO 们纷纷入局:买 GPU、接 GPT-5、搭 LangChain、招 AI 工程师。但半年下来,真正产生业务价值的案例寥寥无几。
一个真实的对话:
CEO:“我们投了 200 万做 AI,为什么 ROI 没提升?” CTO:“模型效果很好啊,GPT-5 的 benchmark 都是 SOTA…” CEO:“我要的是广告投放 ROI 提升 20%,不是 benchmark 第一。”
这个问题,几乎每个做 AI 转型的企业都会遇到。
核心矛盾:模型能力 ≠ 业务结果。
从最强的模型到最终的业务指标(ROI、用户体验、商业化变现),中间隔着至少 7 层漏斗。任何一层的缺失或薄弱,都会导致"叫好不叫座"。
本文将用 Ad Agent(广告投放智能体) 作为实战案例,系统讲解:
AI 应用交付的 7 层漏斗模型(自顶向下设计方法) 技术选型:LangGraph vs 自研 vs Claude Code? 实施路径:从 Skill 验证到生产系统(含代码示例) 不同规模企业的最佳实践(<10 人 → 500 人) 一、AI 应用交付的 7 层漏斗 1.1 漏斗模型:最强的模型 ≠ 最好的业务结果 ┌─────────────────────────────────────────────────────────────────┐ │ L1 业务指标层 最顶层:ROI、用户体验、商业化变现 │ │ ↓(很多团队在这里就断了) │ │ L2 业务抽象层 基于指标定义场景和工作流 │ │ ↓ │ │ L3 应用设计层 基于编排的应用层,监控/审核/存储等 │ │ ↓ │ │ L4 流程编排层 Human-in-the-loop,人/模型/系统协调联动 │ │ ↓ │ │ L5 上下文工程层 高质量输入 → 高质量输出(Harness 工程) │ │ ↓ │ │ L6 模型调用层 合理调度模型,避免大材小用或力不从心 │ │ ↓ │ │ L7 模型能力层 最底层:模型本身的推理、理解、生成能力 │ └─────────────────────────────────────────────────────────────────┘ 关键洞察:
...
企业 AI 的集体 FOMO AI 应用,尤其在编程等可验证场景,已经给个人带来了十倍效能提升。但这种个人层面的效率革命,并没有相应地转化为公司级的业务增长。这种落差,正在引发企业的集体 FOMO(Fear Of Missing Out)。
我们看到的典型场景是:
开通了各种订阅,额度不限——公司给全员开通 Copilot、Claude 等服务,但没人说得清 ROI 在哪里 员工刷榜比谁消耗的 token 多——账单越涨越高,业务指标却原地不动 AI 应用层出不穷,真正有用的没几个——Demo 好看、上线即死、Pilot 成功但规模化失败 McKinsey 2026 年的数据很残酷:62% 的企业在试水 AI Agent,但只有 23% 成功规模化。MIT 的研究更直接:95% 的生成式 AI 试点项目零可衡量 ROI,300-400 亿美元的企业投资基本打了水漂。
行业推波助澜下的真相 从 VC 到大模型公司,从传统软件厂商到咨询公司,都在推波助澜。但拨开喧嚣,几家行业先锋的观点反而值得仔细品味。
红杉资本:每花 $1 买工具,就花 $6 买服务 红杉资本 2026 年 3 月发表的《Services: The New Software》一文,给出了一个结构性洞察:
“For every dollar spent on software, six are spent on services.”
Gartner 2026 年的数据交叉验证了这一点:全球 IT 支出首次突破 6 万亿美元,其中 IT 服务占 1.86 万亿(最大单项),企业软件仅 1.4 万亿。加上专业服务市场的 10.5 万亿,工具和服务的比例确实是 1:6 甚至更高。
...