新贵擎怎么从成为云核算无名小卒 ,揭秘火山引

2025-07-04 07:28:59 

文|白   鸽 。揭秘  。火山核算

编|王一粟。引擎

AI,从无现已成为火山引擎打破云核算商场格式的卒成一张主力 。

2020年6月 ,新贵字节跳动正式推出火山引擎,揭秘2个月后,火山核算谭待脱离百度 ,引擎挑选参加火山引擎 。从无

本年 ,卒成是新贵谭待掌握火山引擎的第五年 ,也或许是揭秘其最高兴,且最沉着的火山核算一年 。

“刚开端面试火山引擎的引擎时分 ,一些有阅历的朋友跟我说‘字节肯定做不起来’。”谭待说道 ,这也是压力最大的阶段 ,但“现在他们会跟我说 ,火山做得还挺好。” 。

字节跳动做云核算 ,比同行晚了10年,在我国公有云商场的排名中 ,也是列归于other系列 。也正因而,关于字节跳动做云核算,许多人并不看好 。

但现如今的火山引擎,不管是在字节跳动内部 ,仍是在外部职业  ,都开端支棱起来了。

2025年的火山引擎Force原动力大会(春季) ,比以往来得更晚一些,但却是历年以来参加人数最多的一次 ,整个国家会议中心二期的场馆中  ,每个展厅都坐满了来参会的人 。

一同,字节跳动CEO梁汝波的初次揭露站台,也给了火山引擎,并表明:“做好火山引擎 ,对字节跳动成为一家优异的科技公司 、坚持技能竞赛力很重要 。” 。

从外部商场来讲 ,火山引擎官方数据显现 ,上一年12月 ,豆包大模型的日均Tokens调用量是4万亿 ,本年3月份到达12.7万亿。

到5月底 ,豆包大模型日均Tokens运用量超越16.4万亿 ,较上一年5月刚发布时增加了137倍 。

别的 ,据IDC陈述显现 ,2024年火山引擎在我国公有云大模型服务调用量上稳居榜首 ,商场份额46.4%,紧随其后的则是百度智能云和阿里云。

对此,谭待表明 ,这部分的调用量核算则首要来自外部,而非豆包、即梦等字节内部耗费 。

火山引擎的开展到达了史无前例的速度。这全部 ,得益于火山引擎对AI的押注 。

不过,谭待也坦言 :“AI带来了一个新赛道 ,咱们可以很快做到榜首 ,但在IaaS等公有云商场的存量赛道中 ,火山引擎还需求一点点往上走。” 。

上一年,火山引擎营收破百亿,本年预期营收到200多亿,而早在2021年 ,谭待对火山引擎未来的营收预期是1000亿。这也就意味着,火山引擎的万里长征 ,才刚刚走出榜首步 。

“咱们本年的方针仍是很急进的 。”谭待说道 ,“究竟现阶段职业对AI的需求明晰明晰而巨大 。”。

打赢云核算排位赛,不只靠价格战。

在火山引擎之前 ,谭待曾任百度查找 、网盘和根底架构首席架构师 、T11等级技能专家 ,乃至有坊间传言,他还曾向百度智能云总裁沈抖报告过作业。

谭待接收火山引擎后 ,对其技能架构进行了更新和晋级 。不过  ,比较于技能体系,彼时的谭待接受的压力,首要来自商场拓宽 。

据弗若斯特沙利文数据显现,2021年上半年,我国公有云商场格式根本已定 ,排名前五厂商占有了全体83.8%的商场份额 ,阿里云、华为云、腾讯云三分全国 ,运营商云中的天翼云排名第四 ,彼时火山引擎还仅仅边际玩家。

也正是这一年,谭待给火山引擎设立了,未来8-10年要完结营收1000亿的方针 。

彼时谭待为火山引擎开辟的商场增加空间 ,则来自多云商场趋势的开展。

但于火山引擎来说 ,多云战略的运用仅仅使其取得了参加这场游戏的资历,却并未使其在这个竞赛剧烈的商场中取得优势 ,更不用说改动整个商场格式,乃至也一向未成为我国第四朵云 。

不过 ,在刚开端树立的前三年 ,火山引擎一边在拼命追逐根底设施的建造 ,一边尽力寻觅差异化 ,企图在高度老练和内容的职业中 ,杀出一片天空。

时机总是留给有预备的人 。

2023年头,AI大模型迸发,这给火山引擎带来了新的增加引擎。

面临一个新鲜事物,全部的新老玩家 ,简直都处于同一同跑线上。这对本来起步晚的火山引擎 ,现已很好了。

“这几年AI快速遍及,我觉得仍是挺走运 。”谭待直言 ,“AI公司的需求不小 ,但要求很高 。许多公司挑选火山,不是因为咱们有卡 ,而是因为咱们可以安稳地把模型练习出来。”。

前期火山引擎的方舟渠道 ,也是集成多种干流大模型,为客户供给模型练习 、布置等服务 。

不过,自上一年5月火山引擎发布字节自研基座大模型豆包之后 ,火山引擎在对外推进AI落地的进程中,更多是以豆包大模型为主。

一同,以豆包为根底,火山引擎首先敞开大模型价格战,让大模型定价进入厘年代 。

而用价格换规划 ,契合互联网大厂过往的一向打法。这一行为 ,也一度引发谭待和前领导沈抖之间的隔空骂战 。紧随火山引擎之后,我国云厂商纷繁开打大模型价格战。

价格战带动了Token耗费  ,也就带动了云上算力的出售。对云厂商们来说 ,水面之上,打的是AI和价格战 ,水面之下 ,做的却仍然是算力的生意 。

本年,火山引擎的价格战仍然继续,但此次不再是粗犷的一刀切 ,而是依据影响模型本钱最要害的输入输出长度来定价 ,详细来说:

输入区间在32k-128k规划,豆包1.6价格是输入1.2元每百万Tokens,输出16元每百万Tokens;在输入区间128K-256K规划内 ,豆包1.6价格是输入2.4元 ,输出24元 。关于绝大部分企业运用会集的0-32K规划,经过技能优化 ,豆包1.6价格是每百万Tokens 输入0.8元 ,输出8元。

“关于Agent而言,其需求处理许多杂乱使命,对Tokens的耗费量十分巨大 。”谭待对光锥智能说道,“因而咱们这次立异做了区间定价 ,能会集把企业用最多的区间本钱下降63% ,相当于只需求曾经三分之一的价格  ,就可以取得平等模型才能。”。

但此次火山引擎对豆包1.6的定价,并未像上一年相同 ,与职业定价摆开很大的距离 ,“贱价仅仅刚开端对咱们有协助,现在咱们的定价都差不多。”谭待也直言道 。

贱价在短期内可以招引一些用户体会,但关于B端企业用户来说,愈加重视模型的终究落地作用 ,对产品的容错率十分低 。

也正因而,对火山引擎来说 ,环绕豆包大模型构建ToB服务体系 ,带来两个长处:

一是豆包大模型源于字节跳动内部研制  ,尽管其纷歧定是职业现在最强的基座大模型 ,但火山引擎更懂它的长处 ,让客户终究的体会更好  。

“豆包很灵敏 ,言语大模型才能也比较老练 ,全体客户体会感比较好 。”一位AI玩具代工厂的相关负责人对光锥智能说道 ,“咱们也同步测了国内外其他干流大模型产品,但全体下来 ,仍是豆包这一套体会比较好,响应速度也比较快  。” 。

事实上,在抢占商场中,字节跳动不吝下血本 ,除掀起大模型降价 ,还免费给许多硬件公司装上大模型 。“咱们在商场开辟期 ,会免费给客户接入豆包大模型 ,还会做1对1的调试和服务。”一位字节跳动旗下的智能体渠道纽扣的研制人员对光锥智能表明。

此次大会上火山引擎发布的豆包1.6版别,在深度考虑推理才能上也现已有了更大的提高 。

如针对高考全国新一卷数学单科测评,豆包成果144分 ,全国榜首 。高考前火山引擎团队针对海淀区模仿全卷进行测评 ,豆包1.6相对上一年体现,理科成果显著提高154分 ,文科则提高90分。

别的 ,更为重要的一点是,字节的 C 端产品有许多用户,会大规划调用模型,能帮火山引擎做好服务  ,一同也会有许多用户拿着C端的产品Case过来,期望火山可以将其落地在事务中。

“所以咱们有一个优势,C端豆包APP用户十分多 ,在这个过程中 ,就总结了许多怎样做好杂乱Agent的最佳实践,并经过火山引擎对外供给服务 。”谭待说道 。

价格低 、模型作用好 ,还有许多C端用户与B端协同,这让火山引擎在短短一年之内 ,就登顶了我国公有云大模型调用量榜首 ,完结了千亿营收方针中,万里长城的榜首步 。

火山引擎 ,怎样搞定AI客户 ?

细节决议胜败 。

除了上面这些战略级的打法,咱们在与火山引擎多个客户的交流中,还发现了一些细节的隐秘。

上个月 ,瑞幸咖啡在小程序界面中上线了一个根据豆包大模型打造的AI点单智能体,而就这个智能体的上线 ,瑞幸咖啡与豆包的协作也阅历了一段曲折。

“这个智能体研制时刻仍是蛮久的 ,前期直接对接的豆包,它们日活许多 ,流量很大 ,所以最开端压测就没过。”瑞幸咖啡相关负责人对光锥智能说道,“后来是火山出场 ,协助豆包处理了这些问题 ,和咱们一同对整个架构从头做了优化 。”。

所谓的压测,是指对大言语模型进行压力测验,以评价其在高负载条件下的功用和安稳性。

众所周知 ,像瑞幸咖啡这种依靠线上小程序点单的店肆 ,往往会有顶峰波谷时刻段 ,其需求满意在顶峰时期 ,瞬时流量对大模型的安稳性要求 。

明显 ,在火山引擎出场之前,豆包对瑞幸咖啡的轻量化交给并未完结 。

不过 ,比较于瑞幸咖啡这种存在顶峰波谷的需求 ,AI玩具就不需求以很重的方法,去做产品集成开发。

而这种轻量化交给,也可以给豆包带来比较高的调用量 。

“咱们直接跟豆包签定的协作 ,现在这个产品现已出售了几十万单  。”上述AI玩具生成商相关负责人说道  ,“尽管详细运用豆包Token的量还没测算出来,但(出售)反应说咱们这两个月 ,尤其是端午节后,AI玩具的消费全体比较多 。” 。

除了新消费、AI玩具硬件等职业,火山引擎在轿车、金融、教育等职业落地也十分快。

其间,在消费电子职业,全球Top10手机厂商有9家和火山引擎深度协作;轿车职业中 ,豆包大模型助力了多半干流轿车进行AI晋级;金融职业中 ,火山引擎已服务华泰证券 、国信证券等数十家券商和基金公司 ,招商银行 、浦发、民生等70%的体系重要性银行;教育职业中,火山引擎已与北京大学 、浙江大学、南开大学等超五成985高校到达协作。

值得一提的是,本年以来,火山引擎的轿车职业大客户数量明显增加,本次大会BBA代表宝马和奔驰 、荣威 、极氪都为其站台,集成豆包大模型打造了智能座舱的极氪009光芒也现场展现 。

在4月份上海车展官宣协作的上汽荣威 ,宣告两边将推进AI模型上车 、AI大数据全面赋能轿车 ,打造“更懂顾客”的荣威AI轿车 。

对轿车职业客户而言,火山引擎除了嵌入豆包大模型的才能外 ,还会嵌入字节跳动的内容资源。

比方极氪的智能座舱接入了抖音集团全部互联网渠道,包含抖音视频 、本地日子等。“这样可认为用户快速提高整个座舱的感知体会。”极氪智能座舱高档总监李程峻说 。

除了这些传统各行各业的企业外 ,火山引擎也留意到了一些新式企业 。

“AI年代诞生了许多优异的创业公司 ,这些公司尽管人员少,但却根据AI所诞生,一个人可以做许多事 ,所以可以继续迭代,功用研制也很快  ,每天Token耗费也许多。”谭待说道。

重生的AI创业公司 ,正在逐步成为云厂商的“绩优股”客户。

现在,谈到AI年代的落地,更是离不开Agent(智能体) 。

“Agent可以自主感知 ,规划和反思,完结杂乱使命,软件也是榜首次从被迫的东西 ,变成自动的执行者。”谭待说道。

“当时主体已产生改变 ,云原生体系是为Web、APP等最佳实践规划,但当AI年代主体变为Agent ,就需求规划新的技能栈。”谭待说道 。

如Agent落地不只需求更强更好的模型,还需求有更好的Prompt Pilot,让模型才能强化并处理更特定的使命;Agent所需求处理的数据 ,也不是结构化或非结构化的数据 ,而是要有各式各样更原始的多模态数据 ,所以需求为其构建多模态数据湖。

未来,Agent之间也会相互交流,协同作业,Agent之间的防护、安全就十分重要 ,需求构建针对Agent之间的安全防护体系 ,如火山引擎最新推出的AICC密态核算和大模型运用防火墙等。

火山引擎环绕Agent在企业中的落地,现已形成了一套AI云原生的体系化技能才能和产品,逐步沉积在PaaS层的东西链上。

在云原生年代 ,火山引擎因为起步较晚,一向在补根底东西链的课;但在AI原生年代,火山引擎的AI东西链上的建造,却一向处在榜首队伍,这将是AI落地到千行百业的底气 。

“最重要的仍是树立机制,客户想用好大模型,需求做好 prompt  、模型要精巧  、有适宜的 RAG 常识库 。咱们会组成专门的服务团队 ,和职业线团队做匹配去服务他们。”谭待说道 。

留在牌桌上。

“云核算商场仍是规划决议全部,终究牌桌上一定有火山 。”谭待说道 。

现在来看,火山引擎尽管现已杀入职业前五 ,但全体我国公有云商场格式并未产生很大的改变 ,阿里云 、华为云、腾讯云仍然占有着巨大的商场 。

在AI云商场中 ,各云厂商也都在加码 ,百度智能云对AI云商场凶相毕露,阿里云更是要出资3800亿元构建AI云根底设施 。那么 ,火山引擎凭什么留在牌桌上 ?

在光锥智能看来 ,火山引擎留在牌桌上的筹码首要来自两方面:

一是根据豆包大模型构建的笔直优化才能  。

谭待说:“那些很杂乱的 Agent   ,让它做好杂乱使命,不只模型要优化,背面的服务也得优化  ,还要预备好调优的环境等等。咱们能供给的最大价值 ,是笔直优化的才能 。” 。

一个则是价格战,这儿的价格战 ,不单单仅仅对大模型Token的调用定价,而是在整个面向B端服务时,选用的新式商业化方式 。

比方其打造的智能客服Agent,在面向企业端落地时 ,以往可能是依照项目制或服务费的方式收取费用,但火山引擎智能客服Agent则是依照实践服务量收取费用。

简略来说  ,智能客户Agent一天协助客户回复了多少条信息,火山引擎就收取多少费用 。

“前期咱们首要收一次企业要在体系中做事务处理和体系对接的费用,后续都是依照量去服务收费。”火山引擎智能Agent产品相关负责人对光锥智能说道。

而想要确保智能客服Agent每天所回复100条信息都是有用信息,会有一些观测方针。如教育职业中的客服,包含班主任 、指导老师等 ,会继续跟家长交流学习的进展、讲义常识产品运用等  ,经过人机协同方式,可以看到到课率 、完课率是否下降。假如没有下降 ,就可以确定智能客服Agent可以对标到达真人服务的规范 。

不过,该产品负责人并未直接泄漏每条信息详细的收费规范,但也明晰表明 ,该产品的方针客户集体 ,更倾向于具有上千人力规划的企业,存在真实降本增效的痛点。而这种收费方式的智能客服Agent产品,“每年可以至少为其下降一半的本钱。”。

关于许多云厂商来说,现阶段大模型带来的正向收益并不多 ,更多仍是以售卖底层云算力资源为主 。

而于火山引擎而言,“模型现在带来的成绩增加 ,以及这一块产品收入的增速 ,是在全部产品中最快的 ,远超其他产品,且毛利也是最好的。”谭待向光锥智能说道。

在内卷加重的商场中 ,火山引擎挑选要点押注AI新赛道 ,再以贱价“粗野包围” 。未来 ,它能否真实挺进前三,还需时刻验证。

不过,谭待的决心十分足够:“马拉松刚跑了500米” ,未来商场空间最少会扩展 100 倍 ,火山会继续坚持国内 AI 榜首,在传统云服务的存量商场继续增大。

特别声明:本文为协作媒体授权专栏转载,文章版权归原作者及原出处全部 。文章系作者个人观点,不代表专栏的态度 ,转载请联络原作者及原出处获取授权 。(有任何疑问都请联络idonewsdonews.com)。

发表评论


表情