Skip to Content

14:商业化与未来:从 SaaS 到结果即服务

AI 商业化从 token 预测、产品系统、工作流执行一路走向可验证业务结果的封面图

🧭

这是「用第一性原理理解大模型」系列的第 14 篇,也是主系列的收束篇。第 13 篇:AI Native 产品设计 解释了如何把概率生成系统设计成可预期体验。现在我们继续往商业层走:当 AI 产品不再只是卖软件席位,而是越来越接近交付任务结果,SaaS 的商业模式、定价方式和组织边界会发生什么变化?

前面 13 篇,我们从最底层一路走到产品层:

Token 预测下一个 token Transformer 与 Attention 预训练、对齐、推理 RAG、Tool Use、Agent 工程系统与 AI Native 产品

现在只剩最后一个问题:

当这些能力进入商业世界, 产品到底应该卖什么?

过去的软件商业化,核心是卖工具。

用户购买一个系统、一个账号、一组功能,然后自己把工作做完。

但 AI 产品正在把这件事往前推一步:

用户不只是购买工具; 用户越来越像是在购买被完成的任务。

这就是这一篇要讨论的主题。

不是说 SaaS 会消失。

也不是说所有 AI 产品都必须按结果收费。

而是:当模型、上下文、工具和 Agent 被组合起来,软件开始从「帮人操作」走向「替人完成」,商业模型自然会被重新设计。

一、为什么 AI 商业化不是简单的 SaaS 加价

传统 SaaS 从功能租用走向 AI 产品交付任务结果的转变示意图

传统 SaaS 的商业契约大致是:

我给你一个软件系统; 你按人数、套餐或功能付费; 你自己的团队在系统里完成工作。

这个模型很成功。

因为传统软件有几个特点:

边际成本低; 输出比较确定; 责任边界清楚; 用户仍然负责具体劳动; 软件厂商主要交付功能可用性。

比如 CRM、项目管理、表格、知识库、财务系统、设计工具。

软件把流程数字化、协作在线化、数据结构化。

但最终要做判断、写内容、联系客户、审核异常、推进任务的人,通常还是用户自己。

AI 加进来以后,问题变了。

因为大模型不只是展示功能。

它可以参与认知劳动:

理解需求 读取上下文 生成方案 调用工具 检查结果 持续迭代

于是商业契约开始松动。

用户会自然地问:

既然系统已经能读资料、写草稿、跑流程、检查异常, 那我为什么只为一个「账号」付费? 我真正想买的,是不是这件事被完成?

这就是 AI 产品对 SaaS 的第一层冲击。

它不只是让原来的功能更智能。

它把用户购买软件的理由,从「使用功能」推向了「获得结果」。

二、第一性原理:用户买的不是模型,而是任务结果

用户目标经过模型、上下文、工具、验证和责任边界,变成可购买任务结果的示意图

从第一性原理看,商业化不是先问:

这个模型多强? 这个 Agent 多酷? 这个功能能不能聊天?

而是先问:

用户为什么愿意付钱?

用户付钱通常不是为了模型本身。

用户付钱是为了某个变化:

更快完成任务; 更低成本完成任务; 更少错误完成任务; 更稳定地产生结果; 更少依赖稀缺专家; 更容易扩大业务规模。

所以 AI 产品的商业化链条应该是:

用户目标 可重复任务 可验证结果 可承担风险 可持续成本 可复制交付

这条链条里,模型只是中间的一层。

真正被购买的是任务结果。

但结果不是一句口号。

它必须被定义。

比如:

不是「AI 帮你做客服」, 而是「在指定知识库和权限范围内解决多少工单」。 不是「AI 帮你写销售邮件」, 而是「生成多少合格线索触达和跟进记录」。 不是「AI 帮你做法务审阅」, 而是「在约定合同类型中识别多少高风险条款」。 不是「AI 帮你写代码」, 而是「在测试通过和代码审查通过的约束下完成多少变更」。

当结果可以被定义、度量、验证和复盘,商业模式才有机会从卖软件走向卖结果。

这也是为什么第 13 篇强调产品系统。

裸模型不能直接变成商业结果。

商业结果来自:

模型能力 + 业务上下文 + 工具调用 + 工作流编排 + 评估验证 + 权限控制 + 失败回退 + 运营交付

AI 商业化的核心,不是把模型包装成 SaaS。

而是把概率能力包装成可交付结果。

三、从 Seat 到 Token,再到 Outcome

软件定价从席位、用量、任务逐步走向结果计费的模式演化示意图

AI 产品的定价,大致会在四种模式之间摆动。

第一种是席位制。

按用户数收费。

这是 SaaS 最熟悉的模式。

它的优点是简单、可预测、容易进入企业采购流程。

但它有一个问题:

AI 的成本和价值不一定跟人数线性相关。

一个重度用户可能每天触发大量推理、检索、工具调用和长任务。

一个轻度用户可能只是偶尔问几句。

如果都按同样的 seat 收费,产品方会承担成本错配,客户也会感到价值感不稳定。

第二种是用量制。

按 token、credit、调用次数、文档量或任务次数收费。

这种模式更接近 AI 的成本结构。

因为模型推理确实会随着 token、上下文长度、工具调用和重试次数增加而变贵。

但纯用量制也有问题。

它会让用户产生心理负担:

我每多问一句是不是都在烧钱? 我是不是应该少用一点? 为什么失败的尝试也要付费?

如果定价只绑定用量,用户可能会被激励去减少使用,而不是把更多工作交给系统。

第三种是任务制。

按一次报告生成、一次合同审阅、一次候选人筛选、一次客服处理收费。

任务制比 token 更接近用户感知。

用户不关心模型消耗了多少 token。

用户关心这件事有没有完成。

但任务制要求产品方清楚定义任务边界:

什么算一次任务? 什么算完成? 失败如何处理? 中途人工接管怎么算? 用户反复修改怎么算?

第四种是结果制。

按成功解决的工单、通过审核的文档、合格线索、完成交付的项目、节省的成本收费。

这是最接近「结果即服务」的模式。

它和客户价值最对齐。

但它也最难。

因为结果制意味着供应商要承担更多责任:

结果是否可归因? 质量是否可验证? 风险是否可控? 成本是否覆盖? 客户流程是否配合? 异常情况由谁处理?

所以未来更常见的不会是单一模式,而是混合模式。

比如:

基础平台按 seat 收费; 高消耗能力按用量收费; 标准任务按任务包收费; 高价值场景按结果或分成收费。

定价会从「一个账号多少钱」变成「不同层级的价值如何被拆分、计量和分担风险」。

四、毛利成为产品设计问题

AI 产品在模型成本、工具成本、人工复核、失败重试和业务价值之间平衡毛利的示意图

传统 SaaS 的一个迷人之处,是边际成本很低。

多服务一个客户,成本当然会上升,但通常不会随着每一次用户操作线性增加。

AI 产品不一样。

每次回答、每次检索、每次工具调用、每次长上下文处理、每次重试,都可能带来真实成本。

更重要的是,用户不为 token 买单。

用户为成功任务买单。

所以 AI 产品真正要看的不是:

单次推理成本是多少?

而是:

每个成功任务的总成本是多少?

它可以粗略写成:

成功任务成本 = 模型推理成本 + 检索与工具调用成本 + 上下文组装成本 + 失败重试成本 + 人工复核成本 + 监控、审计与合规成本

如果任务失败了,但已经消耗了大量 token 和人工审核,那也是成本。

如果模型答得很漂亮,但最终没有被用户采纳,那也不能直接算作商业结果。

这会逼产品和工程团队重新设计系统。

比如:

简单任务用便宜模型; 复杂任务再路由到强模型; 高风险任务必须进入人工确认; 长上下文先压缩和检索; 重复问题使用缓存; 输出必须结构化,减少返工; 关键步骤要有评估和验收; 失败时快速降级,而不是无限重试。

这也是为什么 LLM 定价的数学原理 不只是工程问题。

它会直接影响商业模型。

当 AI 产品开始卖结果,成本控制不再是后台优化。

它变成产品设计的一部分。

五、产品形态:工作流比聊天更容易变现

多个业务工作流经过模型、工具和验证汇聚成可交付结果的示意图

聊天很适合探索。

但商业化通常需要可重复。

如果一个 AI 产品只有聊天框,用户每次都要自己描述背景、粘贴资料、解释格式、判断结果、复制到别的系统里,那它更像一个智能助手。

有价值,但不一定容易规模化变现。

真正容易变现的 AI 产品,通常会把能力收敛成工作流。

工作流会回答这些问题:

输入是什么? 需要哪些上下文? 中间步骤有哪些? 什么时候调用工具? 什么时候需要人确认? 输出格式是什么? 如何判断完成? 失败如何回退? 结果交付到哪里?

比如一个销售场景。

聊天式 AI 可能是:

帮我写一封销售邮件。

工作流式 AI 更像:

从 CRM 中读取目标客户 根据行业和历史互动生成触达策略 为每个客户生成个性化邮件 检查合规和语气 让销售确认 发送邮件 记录触达结果 根据回复安排下一步

前者卖的是生成能力。

后者卖的是业务过程。

如果要走向结果即服务,产品必须从聊天变成工作流,甚至变成 Agent 任务系统。

因为只有工作流,才容易定义边界、计算成本、验证质量、沉淀数据、管理风险。

六、组织边界:AI 产品开始进入客户业务流程

AI 产品连接供应商系统和客户组织流程,并在中间承担任务执行责任的示意图

传统 SaaS 通常站在客户组织的外侧。

它提供系统。

客户使用系统。

客户自己的团队对最终业务结果负责。

但结果即服务会让供应商往客户业务里走得更深。

因为如果你要为结果负责,就必须理解并参与客户流程。

这会带来几个变化。

第一,交付不再只是开通账号。

它还包括:

接入客户数据; 理解客户规则; 配置任务边界; 设置权限和审批; 建立评估样本; 设计异常处理; 训练客户团队协作方式。

第二,客户成功不再只是教用户使用功能。

它更像运营交付。

客户成功团队要关注:

任务完成率; 人工接管率; 错误类型; 节省时间; 质量波动; 成本和毛利; 客户内部采纳情况。

第三,产品团队和服务团队边界会变模糊。

如果 AI 系统还不能完全自动处理长尾异常,产品方可能需要把一部分人工运营包进交付链路。

这听起来不像传统 SaaS。

但它可能更接近真实商业化。

因为许多高价值场景里,客户不是单纯想买一个软件。

客户想买的是:

这个业务环节变得更快、更便宜、更稳定。

谁能承担这件事,谁就更接近价值中心。

七、护城河:不只是模型,而是分布、上下文、工作流和信任

AI 产品护城河由分发渠道、私有上下文、工作流、评估数据、信任和成本运营共同组成的层级示意图

很多人讨论 AI 商业化时,会先问:

模型是不是护城河?

模型当然重要。

但对大多数应用层产品来说,模型通常不是唯一护城河。

因为基础模型会持续进步,API 能力会越来越强,开源模型也会不断追赶。

应用层更值得关注的是另一组东西:

用户分发:你能不能触达并留住目标用户? 私有上下文:你是否接入了用户真实工作数据? 工作流嵌入:你是否已经进入关键业务流程? 评估样本:你是否知道什么才算好结果? 反馈数据:你能否从真实任务中持续改进? 信任体系:客户是否敢把任务交给你? 成本运营:你能否用可持续成本交付结果?

这些东西不一定比模型炫目。

但更接近商业护城河。

尤其是结果型产品。

如果一个产品已经深度嵌入客户流程,知道客户的业务规则,积累了真实评估样本,有可靠的审计、权限和异常处理机制,同时能用更低成本完成任务,那么后来者就很难只靠「接一个更强模型」替代它。

这也是 AI Native 产品和普通模型包装器的区别。

包装器的核心资产是 prompt。

AI Native 产品的核心资产是任务系统。

结果即服务的核心资产,则是被验证过的交付能力。

八、风险:结果越靠近业务,责任越不能靠 prompt 解决

AI 商业化中的质量、权限、合规、审计和人工确认共同形成风险治理边界的示意图

越接近结果,风险越重要。

一个聊天助手答错了,用户可能只是重新问一次。

一个 Agent 错发邮件、错改数据、错判合同、错批费用,影响就完全不同。

所以结果即服务不能只靠一句:

请模型小心一点。

它需要系统级治理。

至少包括:

任务边界:哪些事可以做,哪些事不能做; 权限系统:能读取什么,能修改什么,能代表谁操作; 审批机制:哪些动作必须人确认; 审计日志:每一步为什么发生,使用了什么上下文; 质量评估:如何判断输出对不对、好不好; 异常处理:失败后如何回退、补救、通知; 责任分配:供应商、客户、终端用户分别承担什么。

风险治理不是商业化的阻碍。

它本身就是商业化能力。

因为客户愿意为结果付钱的前提,是敢把任务交出去。

信任不是营销话术。

信任是产品系统能力。

九、未来:SaaS 不会消失,但会被重新分层

未来软件从记录系统、交互系统、智能系统、行动系统到责任系统逐层演化的总结示意图

那么,AI 会不会取代 SaaS?

我的判断是:不会简单取代,但会重新分层。

未来的软件世界可能会有几层同时存在。

第一层是记录系统。

存储客户、订单、合同、文档、财务、知识和权限。

这些系统仍然重要。

因为 AI 需要可靠数据源。

第二层是交互系统。

让人查看、编辑、审批、协作和追踪。

人仍然需要界面。

只是界面不一定是传统表单和按钮,也可能是对话、画布、审阅队列、Agent 工作台。

第三层是智能系统。

理解目标、组装上下文、生成方案、判断下一步。

这是大模型最直接改变的软件层。

第四层是行动系统。

调用工具、执行流程、处理异常、推动任务完成。

这是 Tool Use 和 Agent 的价值所在。

第五层是责任系统。

验证结果、记录轨迹、管理风险、承担承诺。

这是结果即服务真正需要补上的层。

所以 SaaS 不会变成一个旧词。

它会被扩展。

有些 SaaS 会继续卖系统。

有些 SaaS 会变成 Copilot。

有些 SaaS 会变成 Agent 工作台。

还有一部分会从软件公司变得更像「带 AI 能力的服务公司」,直接承诺业务结果。

十、常见误解

误解 1:AI 会让所有 SaaS 都消失

不会。

很多系统的核心价值是记录、权限、协作、合规和组织记忆。

这些不会因为模型会生成文本就消失。

AI 更可能改造 SaaS 的交互层、智能层和行动层。

误解 2:结果计费一定比席位制更先进

不一定。

结果计费只有在结果可定义、可归因、可验证、可控风险时才成立。

如果任务边界模糊、客户流程复杂、质量很难客观判断,强行按结果收费会制造更多争议。

误解 3:只要模型足够强,就可以卖结果

模型强只是前提之一。

卖结果还需要工作流、评估、权限、审计、异常处理、成本控制和客户运营。

裸模型不会自动变成可交付业务。

误解 4:用量计费最公平

用量计费对供应商成本更公平。

但对客户价值不一定公平。

客户想买的是完成的工作,不是消耗的 token。

好的定价应该在成本、价值和风险之间找到平衡。

误解 5:Agent 就等于数字员工

这个说法很有传播力,但容易过度简化。

员工不仅执行任务,还承担责任、沟通协作、理解组织语境、处理例外情况。

Agent 可以承担一部分任务链路,但产品仍然要明确边界、权限、复核和责任。

十一、产品和商业含义:先定义结果,再设计系统

如果把这一篇落到实践,我会建议 AI 产品团队先回答这些问题:

1. 用户真正想交出去的任务是什么? 2. 这个任务的输入、输出和完成标准是什么? 3. 哪些步骤可以自动化,哪些必须人工确认? 4. 结果如何验证,失败如何回退? 5. 每个成功任务的真实成本是多少? 6. 定价单位应该是 seat、用量、任务还是结果? 7. 供应商愿意承担哪些风险,不承担哪些风险? 8. 哪些数据、工作流和评估样本会形成长期护城河?

这组问题比「我们要不要加一个 AI 功能」更重要。

因为 AI 商业化的关键不是有无模型。

而是:

你是否能把模型能力变成客户愿意持续购买的任务结果。

这件事会改变产品设计,也会改变销售话术、客户成功、工程架构、成本模型和组织能力。

过去,很多软件公司的核心指标是:

多少用户登录? 多少功能被使用? 多少 seat 被售出? 续费率怎么样?

未来,AI 产品还要多看一组指标:

完成了多少任务? 成功率是多少? 人工接管率是多少? 每个成功任务成本是多少? 结果质量是否稳定? 客户是否愿意把更高价值任务交给系统?

当指标从使用转向结果,商业模式就会自然改变。

十二、一句话总结

从第一篇开始,我们一直在说:

大模型的底层,是给定上下文后预测下一个 token。

但当这个能力被放进产品系统,它会逐步变成:

理解目标 组装上下文 生成方案 调用工具 验证结果 交付任务

商业化关注的,正是最后这一步。

一句话:

AI 商业化的终点,不是卖更聪明的软件,而是卖可验证、可承担、可持续交付的结果。

这并不意味着每个产品都要变成结果即服务。

但它意味着,AI 会持续把软件从「工具」推向「任务系统」,再推向「结果交付系统」。

至此,「用第一性原理理解大模型」主系列就完成了。

如果把 14 篇合成一句话:

大模型从预测下一个 token 出发, 通过规模化训练压缩语言和世界结构, 再经过对齐、推理、检索、工具、Agent、工程系统和产品设计, 最终进入真实任务和商业结果。

后面适合继续展开的,就不再是主线,而是专题:MoE、长上下文、Prompt Injection、Agent 评测、多 Agent 调度、成本优化、端侧模型、多模态和 Workflow Agent。

最后更新于: