火山引擎发布豆包大模型1.8,于50万亿token洪流中建设AI时代底座

DeepTech深科技,2025-12-23 21:23:43

12月18日,2025火山引擎冬季FORCE原动力大会在上海拉开帷幕。尽管会场已经坐满但仍有不少观众站着聆听,线上直播也已涌入数百万观众。这一次,豆包虚拟主持人换上了红色的西装,以虚拟主播的新形象来主持大会。

在火山引擎总裁谭待的演讲中,他身后大屏幕实时跳动着豆包大模型的调用数据——日均tokens调用量已经突破50万亿。这个数字相比去年同期增长了超过十倍。

“模型只有被调用时才能发挥价值,”谭待指出,“2025年,AI正以前所未有的速度走向规模化应用。如何利用好AI,已经是多数企业的必答题。”他透露,目前已有超过100万家企业和个人开发者使用火山引擎的大模型服务,覆盖百余行业,其中超过100家企业的累计tokens使用量已经突破万亿大关。

具备Agent思维的豆包1.8正式面世

如果说2024年是AI大模型的爆发元年,那么2025年无疑是Agent元年。谭待在演讲中强调,技术演进的主题正在发生根本性变化:“PC时代是网站,移动时代是APP,而AI时代是Agent。它能自主感知、规划与执行,软件第一次从被动工具变成了主动助手。因此,在新的时代,我们也需要新的技术架构。”

为此,火山引擎今天正式推出豆包大模型的最新旗舰版本——豆包大模型1.8。该模型面向多模态Agent场景进行了定向优化,在复杂指令遵循、工具调用与OS Agent操作能力上实现了大幅增强、

评测数据显示,豆包1.8在多项能力上已经跻身全球第一梯队:在通用智能体评测集BrowseComp上去的全球领先成绩;在视觉理解、空间推理、文档解析与视频时空理解等任务中超越了国际顶尖模型。



(来源:资料图)

谭待通过三个现场演示,展示了豆包1.8的Agent思维:

在电商比价与决策上,用户只需提出“帮助找一款降噪好、续航长、预算千元左右的耳机”的需求,豆包1.8就能自动规划流程,调用搜索工具在多个电商平台比对参数、价格、优惠券和送达时间,最终推荐最优选项并附上购买链接。

在超长视频理解与溯源上,面对一段1小时4分钟的交通事故监控视频,豆包1.8能先以低帧率快速浏览全片,定位到车辆刮擦的关键片段后,再自动调用高帧率分析工具,精准地锁定肇事车辆和事故时间。这一能力可被用于安防巡检、在线教育、工业质检等场景。

在超长程复杂任务管理上,豆包1.8模拟企业管理者从邮箱中提取五份项目报告,结合公司年度战略与市场分析,评估了最优项目并以可视化网页形式进行呈现。传统方式由于tokens消耗剧增极易出现中断,而豆包1.8通过上下文管理策略,能够稳定控制tokens的长度,确保数十步复杂的操作可以顺利完成。

Seedance 1.5 Pro:让AI视频告别抽盲盒,实现毫秒级音画同步

当AI文生视频成为创作新常态,一些痛点也开始日益凸显。“这有点像抽盲盒,要得到一个满意的镜头,往往需要反复生成。”谭待表示。为此,火山引擎同时发布了音视频创作模型Seedance 1.5 Pro,在生成质量、可控性和实用性上实现了明显进步。

一段由该模型做自我介绍的创意短片拉开了发布环节:画面中,AI生成的发言人不仅口型与配音完美同步,其叙事节奏、镜头语言甚至微表情都呈现出接近影视级的质感。这归功于模型在原生音视频联合生成架构上的创新,实现了毫秒级音画同步,并支持环境音、背景音乐、多人多语言对话(包括四川话、英语等语言),有效解决了行业内常见的张口无声或口型错位等问题。

更值得关注的是,为了解决抽盲盒式的低效创作难题,Seedance系列即将上线Draft样片功能。创作者可以先快速生成低分辨率样片预览,其关键要素与最终成片高度一致,从而可以实现预览即所得。据火山引擎数据,该功能可以将整体创作效率提升65%,并减少60%的无效成本。

谭待还在现场演示了将多张人物与场景照片合成逼真合影、根据照片生成精细化分解结构图以及虚拟模特试穿等能力,展示了在专业设计与商业营销方面的潜力。

目前,个人用户可以通过豆包App、即梦AI等平台体验Seedance 1.5 Pro,企业用户则可自2025年12月23日起通过火山引擎API接入服务。

打造AI云原生架构,将模型能力转化为业务价值

“在AI时代,传统的PaaS、SaaS分层架构已经不再完备。”谭待指出。当Agent需要自主调用工具、使用云资源与数据库时,必须有一个全新的、面向AI原生设计的技术底座。火山引擎将其称之为AI云原生架构,其核心是将算力以token形式转化为智能,并通过Agent开发平台、中间件与工具链,解决Agent运行所需的安全、调度和观测等问题。

火山引擎的方舟平台上的所有模型都能一键部署于加密计算环境之中,实现端到端加密,确保数据可用不可见。该能力已落地与联想AIPC、OPPO智能手机等终端,并在上汽大众和美中艾瑞等企业场景中用于保护核心知识库和患者隐私数据。

火山引擎此次还宣布推出业界首个AI节省计划,覆盖所有按量付费的大模型产品。企业内的各个部门用量可以进行夸模型积累,享受阶梯式折扣,用量越大越节省,最高可以节省47%的使用成本,让企业用得越多、创新越多、省得越多。

此外,火山引擎也宣布开放豆包助手API,将豆包App背后复杂的Agent思考、搜索、创作等核心能力以API形式输出,企业可借此快速打造属于自己的专属豆包。目前,首批文本相关能力已经上线,多模态与视频通话等能力将陆续开放。

和谭待一起出席大会主论坛的还有火山引擎智能算法负责人吴迪,吴迪进一步阐述了将模型转化为业务价值的系统化思考。他指出,当AI进入企业核心业务,低成本、高吞吐的模型推理与基于数据的自我进化能力,成为两个关键瓶颈。

为此,火山方舟平台推出了推理代工服务。吴迪将其比喻为一台顶级赛车的完整底盘,用户只需插入自己的模型引擎即可驶入赛道。该服务通过弹性伸缩、全栈规模化与分布式缓存等技术,让企业无需运维底层GPU与复杂网络。测试数据显示,对比企业自建的方法,这一方法可将推理效率提升6倍。

而让Agent持续进化的核心,在于强化学习。吴迪介绍,火山方舟基于开源框架VeRL,打造了高效的强化学习平台,将复杂的工程系统进行封装,让开发者只需专注于奖励函数设计、数据闭环等业务逻辑。吴迪以抖音客服的实践为例:通过构建虚拟对话环境,让模型与模拟用户进行海量交互,再基于专业度、服务流程等维度进行强化学习训练,最终让模型在关键业务上的问题解决率提升了大约10个百分点。

“未来,搜索与推荐依然是重要的人机交互入口,而对话是搜索加推荐的增强形态。”吴迪表示。为此,火山引擎整合了向量数据库、记忆库、知识库和AI搜索,为企业提供开箱即用的搜索、推荐、问答一体化能力,助力为其构建新一代智能服务系统。

目前,海底捞的AI助餐管家“AI小捞捞”已经服务一千多家门店,为消费者节约了几成之多的点餐时间;华泰证券的AI原生应用“AI涨乐”融入分析、交易全场景;猿辅导将大模型深度融入教学闭环;同济大学师生利用火山引擎工具创造了超过1.4万个智能体。

在硬件领域,奔驰展示了接入豆包大模型后的更智能、更拟人化的座舱交互;比亚迪分享了与火山引擎合作,仅用四个多月并将多模态创造能力落地车技系统的中国速度;三星则通过豆包大模型,让手机相册中的静态照片动起来,并能一键生成动态壁纸或3D卡通头像。

“让我们更兴奋的,是客户的成功。”谭待在演讲中强调。也许下一次发布会上,他将带来更多关于客户的成功案例。