首轮小范围内测 · 内部方案

方案市场 · 15 天内测落地方案

用一个具体楔子产品做引流,验证「一句话 → 拉方案 → 自动装进项目 → 跑通任务」这条核心链路,并用一套指标体系判断我们做的是一个工具,还是一个平台

50种子用户目标
15 天核心观察窗口
B 站首轮宣发渠道
1+2+1北极星 / 护栏 / 前导

01 · 我们在做什么

01产品理解:卖止痛药,不卖药店

不推抽象的「平台 / 方案市场」,而是用一个有痛点的具体产品当楔子去打。MCP 与平台是藏在后面的交付管道。

核心机制:用户的 Claude(Claude Code)一次性安装平台 MCP 之后 —— 只要说一句「我要一套小红书自动化营销流程」,Claude 就通过 MCP 找到对应方案、自动拉取并装进项目、构建出自动化工作流跑通任务。

MCP = 唯一集成点 · 自然语言 = 搜索框 · Claude 自己 = 安装器。用户几乎零操作,摩擦低,激活天花板高。

第 1 层 · 楔子产品

验证这个具体方案(如小红书营销)有没有人要、能不能跑通、有没有价值。

第 2 层 · 平台

跑通楔子的人,会不会自然扩展去拉第 2、第 3 个方案。这才是「平台」成立的证据。

02 · 为什么定指标

02目标:把「成不成」变成可证伪的数字

工具看激活 + 留存就够;平台必须额外看两件事 —— 用户跨方案扩展(需求侧网络)、社区产生新方案(供给侧网络)。

北极星

来的 N 个人里,跑通了 ≥1 个方案的人数占比(aha 率)。

类型指标防止它骗你
护栏 1跨方案扩展率 — 拉 ≥2 个方案的用户占比防止做出「一个小红书工具」却以为是平台
护栏 2方案跑通成功率(按方案维度)防止靠运气跑通、掩盖质量问题
前导信号用户主动求「还不存在的方案」的次数与内容测供给侧苗头,并直接告诉你下一批做什么方案

03 · 用户走过的每一步

03核心漏斗(指标的骨架)

入口从「平台注册」塌缩成「冲着具体方案来」。两个红点是这次内测最该盯的流失坑。

1
B 站看到具体方案 demo一句话跑出小红书内容 → 想要 · 指标:曝光、点击
2
安装平台 MCP跨 OS / Claude Code 配置 / 认证 · 指标:MCP 安装成功率
坑 1
3
自然语言 → 匹配到对的方案「我要小红书营销」能否精准返回 · 指标:意图匹配准确率
坑 2
4
拉取 + 自动装进项目各种项目结构下的自动安装成功率
5
跑通工作流完成任务 = aha北极星 · 需要结果回传机制
⭐ 北极星
6
发现并拉取第 2 个方案平台信号 · 跨方案扩展率
平台
7
主动推荐 / 上传新方案口碑(NPS)+ 供给侧(上传方案)

04 · 完整指标清单

04指标体系

1 个北极星 + 2 个护栏 + 1 个前导信号,外加你新增的活跃 / 供给 / 渠道指标,全部并入。

指标类型看什么 / 目的数据源频率
MCP 安装数拉新渠道有效性、获客基线MCP 激活日志每日
安装 → 首拉率激活装了之后是否真开始用MCP 日志每日
首拉 → 跑通率(aha)北极星核心价值是否兑现MCP 日志 + 结果回传每日
每日方案查询数活跃需求热度、用户在找什么MCP query 日志每日
7 日方案下载数活跃使用强度MCP pull 日志滚动 7 日
用户活跃度(DAU/WAU、人均查询/下载)活跃是真需求还是一次性MCP 日志按用户聚合每日
拉 ≥2 个方案用户占比护栏平台 vs 工具的需求侧证据MCP 日志按用户聚合每日
方案跑通成功率(按方案)护栏质量与信任基础结果回传每日
跑了什么技能 + 反馈是什么质量/产品报表核心、定位问题方案执行日志 + 反馈群实时/每日
上传过新方案的用户数供给平台能否自增长平台上传日志每日
7 日上传方案数供给供给侧网络苗头上传日志滚动 7 日
用户主动求新方案次数前导下一批做哪些方案MCP 未命中日志 + 反馈群每日
邀请码 → 渠道归因渠道分渠道切片所有指标邀请码绑定关系每用户
NPS传播口碑、能否降 CAC期末问卷/访谈期末

05 · 逐阶段执行

0515 天计划(指标已缝入)

准备期建议放在 15 天之外先做掉,否则宣发当天用户涌进来接不住。每阶段带验证点,达成才算过。

阶段 0 · 准备期(D-3 ~ D0,约 3 天,前置)

把接得住人的地基铺好

  • 埋点:MCP 调用层打通 —— query / pull / 安装结果 / 跑通回传 / 未命中 全部落日志(漏斗数据的命根子)
  • 结果回传机制:方案内置一步,跑完让 Claude 回报「成功/失败」事件给 MCP(北极星的命根子)
  • 邀请码体系:每渠道一个码前缀(如 BILI-xxxx),安装时绑定 user↔渠道
  • 种子方案库:预填 ≥10 个能跑通的方案,旗舰楔子(小红书营销)打磨到「一句话即装即跑」
  • Onboarding:3 分钟快速跑通指南 + 引导落地页
  • 反馈群 + 答疑值班表:微信/飞书群,排好谁在线
  • B 站物料:以「魔法时刻」demo 为主线的视频脚本
验证点:自己冒充新用户,从零跑通核心链路 ≤ 10 分钟;埋点能在后台看到完整一条漏斗。
阶段 1 · 宣发招募(D1 ~ D5)

B 站发布 + 首批接入

  • B 站发布 + 引导落地页上线,所有入口带邀请码
  • 首批用户接入,实时答疑,重点盯 坑 1(MCP 安装)坑 2(意图匹配)
  • 每日采集:MCP 安装数、安装→首拉率、每日查询数、各渠道归因
验证点:招募到 ≥ 50 精准用户;MCP 安装成功率达标(建议 ≥ 80%)。
阶段 2 · 核心观察(D6 ~ D12,约 7 天)

真实使用 + 每日修阻断 bug

  • 用户真实使用,每日看漏斗 + 每日修阻断性 bug
  • 每日采集:aha 率、7 日下载数、人均查询/下载、跑通成功率(按方案)、跑了什么技能+反馈
  • 平台信号采集:跨方案扩展率、上传方案数、用户主动求新方案的内容
  • 挑 5–8 个活跃用户做中期 1v1 访谈
验证点:aha 率跑出真实数字;阻断性 bug 清零;扩展率有非零信号。
阶段 3 · 收口复盘(D13 ~ D15)

梳理数据 + 出复盘报告

  • 关闭招募,补做访谈,发 NPS 问卷
  • 汇总全部指标,标出最大流失点
  • 产出《内测复盘报告》:漏斗看板 + 问题清单(阶段×严重度)+ 用户原声 + 下一步迭代清单 + 渠道结论
验证点:《内测复盘报告》交付,下一步迭代优先级明确。

06 · 数据从哪来

06数据采集对照

大量动作发生在用户本地的 Claude 里,平台唯一能稳定看到的是 MCP 调用日志 —— 所以埋点要埋在 MCP 调用层。

① MCP 调用日志(主力)

  • query 进来:用户说了什么
  • 匹配结果:命中哪个方案 / 未命中
  • pull 是否成功、安装是否成功
  • 跑通回传:成功 / 失败 + 技能名
  • 全部带 user_id + 邀请码(可切渠道)

② 反馈群 + 访谈(补盲区)

  • 主观体验、卡在哪、为什么不用
  • 用户主动求「还没有的方案」
  • 中期 5–8 人 1v1 深访
  • 期末 NPS 问卷

07 · 为下一轮分渠道做准备

07邀请码 → 渠道归因

本轮主打 B 站,但归因机制现在就建好、几乎零成本,下一轮多渠道直接复用。

环节做法
发码每个渠道一个邀请码前缀:BILI-xxx(B站)、WX-xxx(私域)、KOL-xxx(合作 UP)
绑定用户安装 / 激活 MCP 时填邀请码,后端记录 user_id ↔ channel
切片所有漏斗指标都能按渠道拆:哪个渠道来的人 aha 率高、扩展率高、留存好
下一轮用本轮基线判断渠道用户画像与推广 ROI,决定加投哪个渠道

08 · 每天看什么

08日报报表模板

观察期每天一份,5 分钟扫完就知道哪里出问题。

板块内容
漏斗当日新增安装 / 首拉率 / aha 率 / 扩展率,及环比变化、最大流失点
活跃当日查询数、7 日下载数、人均查询/下载、DAU
跑了什么技能技能名 × 调用次数 × 成功率,标红失败率高的方案
反馈群内 + 回传反馈,按方案归类;阻断性问题置顶
供给信号当日上传方案数、用户主动求新方案的原话清单
渠道切片各邀请码渠道的安装与 aha 率对比

10 · 拿到指标的前提

10公司要做什么才能拿到这些指标

不做这几件事,上面所有指标都是纸面的。按 50 人内测的量级,做 MVP 级别即可,别过度工程化。

要建的能力具体做什么支撑哪些指标MVP 做法
① MCP 服务端埋点每次 query / pull / install 都落一条事件:user_id、邀请码、query 原文、命中方案、是否成功、时间戳安装数、首拉率、查询数、下载数、匹配准确率写一张 events 表,事件 append 进去即可
② 结果回传通道方案模板内置「完成上报」一步,跑完让 Claude 回调 MCP 上报 success/fail + 技能名aha 率、跑通成功率、跑了什么技能一个 report 接口 + 方案里加一行上报指令
③ 未命中日志query 没匹配到方案时,单独记原文用户主动求新方案(前导信号)匹配为空时打一条 miss 日志
④ 邀请码系统生成带渠道前缀的码,安装时绑定 user ↔ channel全部指标的渠道切片一张码表 + 安装时写入关联
⑤ 上传方案通道记录谁、何时上传了新方案上传用户数、7 日上传数(供给)上传时打一条日志(本轮大概率≈0,正常)
⑥ 看板 / 日报把上面事件按天聚合成漏斗与活跃数所有指标的呈现先用 SQL 查 + 每天手工导一份 CSV,不必先做仪表盘
⑦ 反馈群记录群内反馈按方案归档,主观体验补埋点盲区反馈、NPS、求新方案一个群 + 一个共享表手动记

一句话排序:① 埋点 和 ② 回传 是必须先做的(没有它们北极星就是黑的);③④⑤ 是顺手加的日志,成本极低;⑥⑦ 用最土的办法(SQL + 表格)先跑,等下一轮人多了再做正式仪表盘。

11 · 具体到人

11角色分工

按 4 个角色拆,每个角色对应明确交付物。团队小可一人兼多角色;若是一个人,就按这个顺序自己切角色排期。

角色负责事项关键交付物主要阶段
工程 / 后端MCP 埋点、结果回传、未命中日志、邀请码、上传通道、出 SQL 看板;扛并发与修阻断 bugevents 表 + report 接口 + 每日数据导出阶段 0 / 全程
产品 / 方案打磨旗舰楔子(小红书)到「即装即跑」、补齐 ≥10 个种子方案、写 onboarding 与回传指令种子方案库 + 3 分钟跑通指南阶段 0 重
运营 / 增长B 站物料与发布、招募、引导落地页、反馈群答疑、收集求新方案原话视频 + 落地页 + 反馈归档表阶段 1–2 重
数据 / 复盘每日看漏斗出日报、盯流失点、组织中期访谈、写复盘报告(可由工程或运营兼)每日日报 + 《内测复盘报告》阶段 2–3 重

典型一周节奏(观察期):工程每天上午导数据 → 数据中午出日报 + 标流失点 → 运营下午盯反馈群 + 推用户做新手任务 → 产品当天修问题方案 → 工程当天修阻断 bug。每天一个闭环。

12 · 出问题怎么办

12应对预案

提前想好「如果 X,就 Y」,出状况时不慌、不临时拍脑袋。

情况触发信号应对
招不满 50 人D5 仍 < 30 人追加私域/社群渠道、找垂类 UP 合作、延长招募 3–5 天;必要时降到「30 人也能得结论」
MCP 装不上(坑 1)安装成功率 < 60%出一键安装脚本 + 录安装视频;群里 1v1 兜底;按失败的 OS/环境归类集中修
意图匹配不准(坑 2)查询命中率低、用户说「搜不到」人工兜底回复正确方案、补关键词/别名、临时把旗舰方案置顶
方案跑不通(aha 低)跑通率 < 50%紧急修最高频方案;把宣发收窄到「最稳的那 1 个方案」,先保核心链路通
装了不用(激活低)安装多但首拉率低群里发「新手任务」引导第一次使用、私聊 push、onboarding 里加默认示例
反馈处理不过来群消息刷屏反馈分级,只先修「阻断性」;体验性问题记录排期、不当场改
B 站没流量播放/点击远低于预期换内容形式(实操演示 > 讲概念)、找 UP 合作、把流量导回私域慢慢转化
服务扛不住并发MCP 报错率升高限流 + 分批放量(先放 20 人跑通再放剩下),别一次性全放

09 · 别踩的坑

09前提与风险

渠道 × 人群匹配

产品硬门槛是「用户得有 Claude Code 且会用」,国内小众。B 站曝光大但精准用户可能少 —— 内容里要设「资格筛子」,落地页第一步就筛。

三个硬前提

  • MCP 层埋点 —— 没有就没有漏斗
  • 结果回传 —— 没有北极星就是黑的
  • 种子方案库 —— 用户来了得有东西可拉

样本聚焦

50 人样本小,本轮聚焦 1 个旗舰楔子,把人都灌进同一条链路。多楔子 A/B 留到下一轮。

供给侧别强求

50 人里几乎没人会真写新方案,上传数本轮大概率接近 0,属正常 —— 重点测「主动求新方案」这个前导信号。