开云体育 从卖token到卖扫尾,这些公司运行让AI背KPI了


自从黄仁勋在 GTC 上大手一挥,荧惑企业把 token 豪侈量算进工程师的 KPI,玄幻的事情就一天比一天多了。
先是 Meta 里面搞起「烧 token 竞赛」,职工为冲 KPI,写死轮回 bot、用低效辅导词刷量;接着亚马逊职工为了讲解我方「高频使用 Agent」,明明不需要自动化的活儿,硬给作念成自动。名义看,这是大厂职工在「卷 AI 使用率」,但背后败露的问题其实更严重:当企业无法预计 AI 的真不二价值时,就只可退而求其次,用「调用量」代替「产出」。

而这种失真,正在变成整个这个词行业的共同逆境。
麦肯锡数据夸耀,88% 的企业依然在至少一个职能中常态化使用 AI,但信得过能被界说为「AI 高绩效企业」,即 EBIT 因 AI 普及迥殊 5% 的,不到 6%。多数预算、算力和工程师时代被参加进去,临了换来的,却常常仅仅一份「看起来很忙」的账单。企业知谈 AI 很遑急,也知谈竞争敌手在用,但问题是:钱到底花得值不值?没东谈主说得清
这其实亦然昔日两年 AI 落地最无语的地方。
因为大多数 AI 公司卖的,本色上如故「器用」。器用是否信得过创造价值,风险自然由采购方承担。更何况,这一次的器用不仅更贵、更复杂,还高度依赖企业自身的数据、过程和组织配合。于是,好多企业临了只可盯着 token、调用次数、Agent 使用频率这些「过程打算」,试图从里面推断 AI 有莫得产生扫尾。
但问题在于,企业信得过想买的,从来不是 token。
CEO 不会因为职工多调用了几次模子而欢跃,董事会也不会因为 Agent 使用率普及就招供 ROI。企业信得过想要的,其实一直都很简便:扫尾,而且是能被考证、能被归因、最佳还能平直写进财报里的扫尾
仅仅昔日,很少有 AI 公司敢为这个扫尾负责。
而当今,一批公司运行尝试改写这件事:他们不再按「卖器用」收费,而是运行平直对扫尾收费,让 AI 信得过背上 KPI。其中,硅谷的 Sierra 与国内的零犀科技,恰好代表了这一模式在海表里的先行探索。
2026世界杯赛事竞猜中国官网本年 3 月份,红杉的一篇著作带火了一个名为「Raas(Result-as-a-Service)」的见地。

著作开篇就抛出断言:「下一个万亿好意思元级公司,将是一家伪装成服务公司的软件公司。」
如何谐和?先看文中界说的两种 AI 贸易模式:Copilot 和 Autopilot。前者卖的是器用 —— 专科东谈主士用 AI 提效,但雇东谈主用 AI 还得额外费钱。后者卖的是「责任效果」自己:AI 平直委用扫尾,客户只为可预计的业务扫尾付费,而不是软件订阅。
红杉的判断是:后者价值高得多。因为数据摆在何处 ——企业每花 1 好意思元在软件器用上,就要在联系服务和东谈主力上花掉约 6 好意思元。AI 的跨越让「卖扫尾」成为可能,Autopilot 公司不错直击这个远超器用商场的职业预算。
这篇著作在圈内激励震荡,原因很简便:一个顶级投资机构,切身把「卖扫尾」的远景和重量点明了,等于给投资东谈主指了下一波重仓标的。
不外,也有东谈主质疑这是投资机构炒见地,但紧随其后的一个融资音信让商场运行矜重注视这个见地的重量。
这个音信来自一家名为 Sierra 的公司。该公司由 OpenAI 董事会主席 Bret Taylor 与前谷歌高管 Clay Bavor 蚁集创立,旨在通过 AI 为企业提供定制化的客户体验解决决议(比如帮用户改订单、退款、调库存),其核脸色念即是让客户「pay for a job well done」。本年 5 月,该公司书记完成 9.5 亿好意思元融资,公司估值迥殊 150 亿好意思元。

要知谈,这一估值是他们ARR(1.5 亿好意思元)的 100 多倍。关于一个刚刚被摆上牌桌的新赛谈来说,这险些依然不是凡俗艳羡上的高估值,而更像是一种明确的下注。
而信得过劝服投资东谈主的,是 Sierra 自己的贸易化发扬。咫尺,他们依然袒护迥殊 40% 的钞票 50 强企业。在客户体验与自动化服务这种高度中枢、又十分敬重安谧性和 ROI 的场景里,大企业不会因为「见地性感」就大界限采购。某种艳羡上,这些客户自己即是最严格的投票东谈主。
而 Sierra 拿下这些客户,自己就在发挥一件事:RaaS 依然不再停留在 PPT 和融资故事里,而是运行完成信得过的大界限贸易考证
在国内,访佛的事情也在发生。而且国内公司还额外讲解了一件事:RaaS 模式能实现界限化盈利和正现款流
让商场注视到这少许的,是一家名为零犀科技的公司。

率直说,国内声称走 RaaS 阶梯的公司不啻他们一家,但现阶段,信得过能拿出盈利数据的却凤毛麟角,而零犀恰正是阿谁少数派
他们作念的事,其实不错谐和成「让 AI Agent 平直去卖东西」。在保障、汽车这些行业里,零犀的 AI 会平直面向 C 端用户调换,从最运行判断用户有莫得兴味,到中间的跟进、保举,再到临了成交,整套销售过程都由 AI 我方完成。这个过程最大的难点在于,你最终要拿扫尾话语 —— 用户是不是确切下单、保单是不是确切成交、钱是不是确切进来是金尺度。
但从 2019 年运行,零犀就遴选为这件事的扫尾负责,并一起走到了今天:从早期负毛利,到 2024 年实现公司级净利转正,再到 2025 年跑出界限化盈利与正现款流。数据夸耀,某头部保障机构接入其智能体后,新增保费迥殊 20 亿元。而若是用传统东谈主机迎合模式完成通常的增量,常常需要一支 800 到 1000 东谈主的销售团队。
岂论是硅谷的 Sierra,如祖国内的零犀,它们都在作念归并件需要胆量的事:把传统上由客户承担的不细则性,主动揽到我方身上
在 AI 仍被多数东谈主手脚「效力器用」的语境下,这种遴选本色上需要鼓胀的时刻底气。因为只须当你确切服气,滚球中国官方网站入口我方的系统大约安谧完成任务、捏续优化扫尾、并经久截止波动时,你才敢签下这样的公约。不然,一次扫尾不达标,吞掉的即是真金白银的亏本。
也正因如斯,RaaS 信得过特地念念的地方,从来不仅仅贸易模式创新,而是它自然会倒逼公司走向另一个维度的时刻探索。而这,碰巧亦然 Sierra 和零犀接下来最值得被拆解的地方。
Sierra 和零犀,名义上看业务辞别很大。Sierra 把「Better customer experiences. Built on Sierra.」挂在官网最显眼的位置,中枢家具 Agent OS 帮企业批量造 AI 客服,谈的是体验。零犀则一头扎进保障、汽车等销售场景,谈的是成交。
但从底层来看,两家公司靠近的是归并个根人性贫乏:如何让 AI 在真实业务场景里安谧地把事情作念完,何况为扫尾负责。正是这个共同的起点,倒逼出了高度相似的时刻旅途。
最初,两家都不是在单纯地卖模子才气,而是在卖任务完成 ——Agent 的设想主义从一运行就指向业务扫尾,而不是简便的生成质料。为此,它们都在大模子之上额外搭了一套践诺、挂牵与评估系统,并对模子自己作念了二次纷扰,让它在特定场景下更可靠、更少犯错、更澄澈什么算好扫尾。更环节的是,两套系统都不是静止的 —— 它们在真实业务里捏续跑、捏续学,越用越强。
这些共性让它们看起来走在归并条正途上。但接下来的岔口,客户体验与销售的本色相反,把两家推向了十足不同的时刻纵深。
当回答对≠能成交
由于对准客户体验,Sierra 的中枢命题是「把事情作念对」,主义是答对问题、少犯错、不出合规风险。围绕这个主义,Sierra 搭建的是一套精密的模子编排体系:15 款以上的异构模子按任务特点单干相助,再由监督者模子及时审查每一次输出。这是一种偏向「组织架构治理」的时刻念念路 —— 把正确性管住,系统就能安谧运转。

但关于对准销售的零犀来说,中枢命题霄壤之别 —— 它不是「对分歧」的问题,因为话术对不等于能成交。举个例子,一位女士在询查保障过程中说「我要和老公磋议一下」,通用大模子可能趁势接一句「好的,您且归磋议」。看起来,这个恢复莫得什么特地。但在实践的销售场景中,一个金牌销售不会让话题就这样闭幕,而是读懂这句话背后的真实操心(比如怕买错或没搞懂保障范围),并作念进一步极力。
这种情况下,模子必须学会向高转机标的歪斜。因此,零犀信得过需要的是一套赏罚机制 —— 作念对了给正向激励,没达到预期就施加处分,开云(中国)一站式服务官方网站通事后磨真金不怕火捏续把模子的权重推向想要的标的。
但这个后磨真金不怕火过程,远比磨真金不怕火模子去作念编程等任务坎坷,因为销售场景的难点是全场地的 —— 数据稀缺、信号寥落、归因复杂,而且根底无法在虚构环境中考证。
咱们知谈,销售的成交率本来就低,实践场景里可能只须百分之几,大部分用户都不会成交。这意味着你拿到的正向反应自然珍稀,没办法像磨真金不怕火代码模子那样 —— 写一段代码,跑一下看有莫得报错,就能坐窝得回明确的对错反应,进而产生多数磨真金不怕火数据。销售扫尾是由真实的东谈主来决定的,你没办法造出一个虚构用户,设定「只须这样说他就一定会买」,这个环境根底不存在。
归因则是更复杂的问题。一单成交了,是因为 AI 话术好,如故客户本来就有购买意向?一单丢了,是 AI 政策失实,如故客户客不雅原因?这和「抽烟是否导致肺癌」是归并类问题 —— 不是个体能平直考证的,必须靠多数真实样本的统计因果分析才能修复的确的归因逻辑。
但统计也不是全能的,因为好多时候基于统计的大模子无法区别信得过的因果和不实的联系,这亦然所谓「幻觉」的根源。当模子看到「调换时代长」与「成交」之间存在统计联系,它可能就学会拚命蔓延对话,却不知谈若是用户一直在投诉,聊再久也不会买单。单纯依赖统计因果,模子会减轻被污染变量带偏,这正是销售场景里最容易踩的坑。这亦然为什么通用大模子岂论才气多强,在销售转机这件事上都难以平直贬责。
零犀的冲破口:让模子学会「因果」
正因为销售场景存在以上这些问题,零犀临了走出了一条和通用大模子很不一样的后磨真金不怕火旅途。这条旅途的环节,不是单纯让模子「更会说」,而是让模子在后磨真金不怕火阶段学会:用户买,为什么会买,什么政策信得过灵验、为什么灵验,以及什么样的政接应该被捏续虽化
为了达到这个主义,最初,它解决的是「归因」这件事。
前边提到,销售最大的难点之一,是模子很容易被不实的统计联系带偏。这里的问题不在于模子不会统计,而在于它不知谈信得过起作用的「因」是什么。
是以,零犀千里淀的并不仅仅凡俗对话数据,而是一套尽可能因果完备的全链路数据:用户其时是什么景况、浏览了什么页面、AI 为什么遴选这个政策、用户后续又给出了什么反应…… 这些信息都会被完好记载下来,并千里淀为领域因果学问图谱,作为事实底盘敛迹模子输出。因为只须「因」鼓胀完好,模子才不会只学到名义的联系性。
但数据仅仅基础,更难的是把销售履历信得过变成模子才气
好多销冠并不一定能准确说清我方为什么利害,但他们常常知谈:什么情况下应该激动,什么情况下应该移动话题,什么情况下用户信得过的操心其实莫得说出口。零犀作念的,是把这些正本存在于东谈主脑中的履历,拆解成一套「用户景况识别 — 政策遴选 — 扫尾反应」的因果逻辑,再通事后磨真金不怕火千里淀进模子。这套「逻辑因果」方法与「统计因果」共同作用,使得模子的输出愈加可靠,能让模子知谈什么该奖、什么该罚、什么样的政策值得被强化学习捏续放大。
此外,起作用的还有反事实推理。系统不仅记载「作念了什么」,还会评估「若是没作念会如何」—— 对每一次未成交,它会复盘:比如在给更生儿父母先容保障时,若是其时没讲性价比,而是络续聊孩子保障缺口,转机率瞻望能到些许?这种从「没发生的事」里索取学问的才气,让模子在真实数据寥落时依然能捏续学习。
当这些才气修复起来之后,系统的自主进化才信得过运走运转。
由于零犀自己即是按扫尾收费,它自然大约拿到最平直的反应闭环。哪些政策带来了更高转机,哪些用户会在什么节点流失,哪些纷扰时势实践上此地无银三百两,系统都能在真实业务环境中捏续完成评估、归因和政策调优。
与此同期,新的业务步伐、奏效案例和失败告诫,也会被延续加工成结构化的因果学问片断,从头千里淀回模子与学问图谱之中。跟着服务界限扩大,系统对用户谐和、政策遴选和委用才气的累积也会越来越深,最终酿成一种捏续自我优化、自我进化的后磨真金不怕火体系。
因此,零犀的壁垒,本色上并不是某一个单点时刻,而是一套延续自我强化的飞轮:因果完备的数据、业务 know-how 的 AI 化,以及真实业务环境中的捏续迭代,三者互相咬合,最终酿成了一个会越跑越快的后磨真金不怕火系统。

而撑捏这个飞轮捏续运转的,是一支优秀的后磨真金不怕火团队。除了来自头部高校和大厂的算法工程师以外,零犀还经久引入深耕行业十年以上的销售大家。他们参与的并不仅仅「标注数据」,还在匡助系统回答一个更难的问题:顶级销售信得过灵验的才气,到底该如何被 AI 谐和、拆解和复制。
当咱们把视野从具体的时刻细节拉回来,会发现 Sierra 和零犀的探索,其实正在回答 AI 行业一个更根底的问题:AI 到底应该如何创造价值,又该如何被订价
这两年,一个趋势正在变得越来越彰着:单点器用的壁垒正在被快速阐发。Claude Code 等 Agent 家具的出现,让好多专门器用,变成了「用时生成、用完即弃」的东西。器用自己的价值,正在以肉眼可见的速率被稀释。但与此同期,另一件事情的价值却在情随事迁:把责任信得过作念完、作念好的服务。
原因很简便。器用仅仅过程里的一把锤子,你买了锤子,还得我方去钉钉子,钉歪了、钉错了,包袱都在你。但服务委用的是「把钉子钉好」这件事自己 —— 扫尾细则,风险移动。
这其实亦然 AI 从出身第一天运行,东谈主们信得过时待它作念到的事情 ——成为一个能零丁背 KPI 的数字劳能源。谁能信得过作念到这少许,谁能拿到的商场,就会比传统软件大出一个数目级。
而 RaaS 这个赛谈更值得关注的地方在于,它的护城河并不会跟着基础模子升级而被削弱,反而可能越来越深
因为 SaaS 卖的是器用,客户今天能买,未来也能换;但 RaaS 一朝运行端到端地委用扫尾,它就会逐渐镶嵌客户信得过的业务过程。更环节的是,每一次真实委用,都会千里淀新的扫余数据、行业 know-how、政策履历和合规逻辑。这些东西不会因为底层模子升级就被清零,相背,模子越强,它们的价值反而越会被放大。
还有一个容易被疏远的变化是:当客户运行习尚「按扫尾付费」之后,他们会反过来用这套尺度去条目整个自后的 AI 服务商。
这亦然为什么,零犀提到说,他们的一些大客户,依然运行不再柔柔「你用了哪个模子」「参数目是些许」,而是平直追问:「你到底能不行把转机率作念上去?」一朝行业运行用扫尾而不是功能评估 AI,整个这个词竞争逻辑都会被透顶改写。
是以,先发者信得过占据的,并不仅仅时代窗口,而是界说步伐的才气
回到著作发轫,那些大厂里面为了冲 AI 使用率而豪恣「烧 token」的古怪场景,本色上其实败露的是归并个问题:AI 的价值,长久莫得被信得过罢了。而 RaaS 信得过遑急的地方,碰巧在于它把这件事从头拉回了正轨。
从本色上来讲,这是一种价值转头:让 AI 信得过对扫尾负责,让收益和风险对都,也让「出产力」这个词第一次信得过回到贸易天下最朴素的预计尺度里 —— 到底有莫得把事情作念成。
摩根士丹利 2026 年头发布的论说将 AI 界说为第六次时刻转变。前五次时刻转变的历史依然反复考证:短期卖「铲子」的基础法子商最先赢利,经久最大价值却千里淀在哄骗层和遴选者手中。由于这种出产率红利的滞后性,AI 对出产率的实质性带动可能要到 2030 年之后才会充分败露。当泡沫退去、杂音消灭,信得过穿越周期的,永远是那些勇于为扫尾负责、把时刻转机为出产率的公司。
这也正是 RaaS 最值得被经久看好的底层逻辑。零犀和 Sierra 的探索,不是在作念见地,而是在重演一个被历史反复考证的脚本:谁能把「铲子」用好,把责任信得过作念完,谁就能界说下一个十年。