张一鸣藏了一手,抖音AI冲上全球第一梯队
字节跳动按下了AI智能体发展的快进键。
豆包1.5深度思考模型发布
随着 AI 技术的快速发展,AI 已经快速迈入 Agentic AI 时代。
近日,火山引擎总裁谭待宣布,火山引擎正式发布豆包1.5·深度思考模型。

图源:火山引擎公众号
深度思考模型是让 AI 模拟人类的思维过程,对复杂问题进行精准分析和逻辑推导。
对于这一点,火山引擎团队表示,豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中,已经达到或接近全球第一梯队水平;在创意写作等非推理任务中,可以适配广泛和复杂的使用场景。

图源:火山引擎公众号
就技术层面而言,豆包1.5·深度思考模型采用 MoE 架构,总参数为2000亿,激活参数仅200亿,比同等类型的大模型省了近一半的资源。
与此同时,豆包1.5·深度思考模型的响应速度却并未缩水,API延迟低至20毫秒。

图源:百度
就解决问题层面而言,豆包1.5·深度思考模型通过定向训练,在查询互联网信息,进行多轮搜索和思考时,已经可以做到“边想边搜”。
区别于其他推理模型的“先搜索再思考”,豆包可以更高效精准地解决用户的问题,如同和人面对面交流一般。

图源:百度
就理解能力层面而言,豆包1.5·深度思考模型具备视觉理解能力,能跟人一样对文字和画面进行思考,使思考结果更加综合立体,如同拥有了“大脑”和“眼睛”。

图源:百度
不难看出,豆包1.5·深度思考模型拓宽了AI的想象力空间,给用户提供了更便捷的AI选择,让AI与人的交互更为亲密了。
此外,在发布豆包1.5·深度思考模型的同时,火山引擎还对豆包·文生图模型3.0和豆包·视觉理解模型进行了升级。

图源:火山引擎公众号
升级后的豆包·文生图模型3.0,优化了文字排版表现,拥有了实拍级的图像生成效果,还能生成2K 的高清图片,几乎涵盖了各类图片使用场景。
因此,豆包·文生图模型3.0直接在最新的文生图领域权威榜单上进入了全球第一梯队。

图源:火山引擎公众号
而升级后的豆包·视觉理解模型具备更强的视觉定位能力,可以更精准定位,满足各类定位需求。
与此同时,豆包·视觉理解模型的视频理解能力更智能了,可以直接进行语义搜索,以及对食品进行记忆理解等。

图源:火山引擎公众号
值得一提的是,火山引擎还针对不同需求,发布了对应的模型来解决更具体的场景问题——
面向Agent服务,发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件。

图源:火山引擎公众号

图源:火山引擎公众号
正如火山引擎CEO谭待所言:“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”
显而易见,字节跳动对于布局AI产业生态和持续发展是认真的,或许是想趁着AI的风口,寻找新的增长点。
字节跳动布局AI
字节跳动对于AI的布局早已开始,其AI布局已涉猎多个板块,由一张图即可看出——

图源:百度
可见,字节跳动的AI产品覆盖聊天、创作、教育等场景,包括聊天机器人豆包、AI视频即梦、AI写真星绘、AI搜题Gauth、AI修图醒图等20+应用,其中半数产品同步在海外市场进行布局。
其中,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿。

图源:火山引擎公众号
IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

图源:百度
显而易见,字节跳动的AI布局已经在AI市场上不仅是占据一席之地,还可以说是全面开花。
而这些都与字节跳动逐步的铺垫和积累息息相关——
2016年,字节跳动成立AI Lab,设立计算机视觉、自然语言处理、语音处理等团队,早期聚焦推荐算法优化,支撑今日头条和抖音的精准推送。
虽然当时字节跳动并未将重心放在AI方面,却也积累了算法、模型等技术,为后来布局AI埋下了伏笔。
2023年,字节跳动成立Seed团队,启动大模型自主研发,构建三层技术架构——
Stone(技术中台):整合算法资源,支撑多业务线协同;
Seed(大模型研发):推进豆包大模型开发;
Flow(应用开发):快速落地AI产品。
2024年,字节跳动开始进入全面开花阶段——
一面布局C端产品矩阵,推出豆包、星绘、Gauth等软件;
一面布局硬件生态,发布首款AI智能耳机OlaFriend,支持语音唤醒豆包大模型,联合李未可推出AI眼镜Meta Lens Chat,集成AR导航与实时翻译。
2025年,字节跳动更是宣布1600亿元AI投资计划,其中900亿用于GPU采购(60%算力预算投向国产芯片),同时已建成万卡A100/A800集群,支撑大规模训练需求。
回顾字节跳动的AI布局发展,不难看出,其目的是想要开辟新的增长曲线,在AI方向寻找新的突破与创新,并且取得了一定的成效——
AI算法驱动抖音、今日头条用户使用时间增加;AI赋能电商直播GMV增加;AI工具增加收入;开拓AI短剧、虚拟陪伴等新付费场景……
不过,字节跳动的AI发展依旧存在一定隐忧,比如,豆包大模型在复杂推理、长文本处理等场景仍落后于OpenAI等头部厂商;AI硬件销量未达预期,硬件营收不足,难以支撑研发投入等。
要解决这些问题,在AI市场中创造新的增长点,字节跳动或许需要更多的技术创新。
AI之争如火如荼
如今AI的风头正盛,各大企业都想要分一杯AI的时代红利——
就巨头企业方面,字节跳动依托豆包大模型构建闭环生态,但复杂推理能力仍落后头部厂商。
阿里通过AI优化电商搜索与推荐,但技术深度不及垂直AI企业,更多依赖与第三方模型合作。
腾讯和百度则是以“接入替代自研”的策略拥抱DeepSeek-R1模型,降低开发成本并快速补齐能力短板。
就创业公司方面,“大模型六小虎”战略分化,智谱冲击IPO、零一万物转向产业大模型、MiniMax收缩B端业务,部分企业面临边缘化风险。
DeepSeek异军突起,开源模型性能超越头部大厂,7天获取1亿用户,成为行业新星。
不难看出,多家公司押注的AI行业已是未来发展的重头戏,而对于未来AI市场的发展,或许会更注重于便捷与情感——
AI营销工具爆火,伴随着AI技术融入互联网,无论是企业,还是消费者,都能享受到AI带来的创作便捷性。
抖音虚拟陪伴产品“猫箱”用户突破3000万,35%用户日均互动超2小时,或将催生新消费市场。
此外,值得一提的是,DeepSeek的开源策略像在AI界复刻安卓模式,不断催生技术迭代和进步创新,AI的发展速度日新月异,不断激发着人们的想象。
在未来,或许AI与人的交互会谱写出一个又一个新的创意与发展的可能。
不过,在AI这片新的市场之中,到底谁能笑到最后,仍待时间验证。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
