阿里大模型突然震惊全世界

互联网头条
2025-04-30 09:53

马云一出手,让全世界都服气。


1、阿里千问3登顶全球最强开源模型

阿里大模型又甩出一张王炸。

4月29日凌晨,阿里新一代通义千问模型Qwen3(简称千问3)开源,一发布就直接登顶全球最强开源模型。随即相关话题引发全网关注。

图片

图源:微博

这款让全世界震撼的模型,有何特别之处?据了解,Qwen3是国内首个“混合推理模型”,它将“快思考”和“慢思考”集成进同一个模型,能快速低算力处理简单问题,也能通过多步骤深度推理解决复杂问题,有效降低算力消耗。

目前,Qwen3系列模型一共开源了8款“混合推理模型”,包括两款MoE(混合专家)模型Qwen3-235B-A22B和Qwen3-30B-A3B,以及六个Dense(稠密)模型32B、14B、8B、4B、1.7B和0.6B

图片

图源:阿里云

那么,Qwen3又强在哪里?首要原因是算力成本大幅降低,直接碾压全球各个顶尖大模型

比如旗舰模型Qwen3-235B-A22B参数量仅为DeepSeek-R1的1/3,总参数量235B,激活仅需22B。

据市场多方消息,仅需4张H20即可部署Qwen3满血版,而且Qwen3旗舰模型的部署成本是满血版R1的25%~35%,部署成本大降75%~65%,显存占用仅为性能相近模型的三分之一

其次,Qwen3大模型的性能也比同类大模型更强,在多个基准测试中表现出色,甚至超过了DeepSeek-R1和OpenAI o1等顶级模型

在Qwen3系列模型中,旗舰版本Qwen3-235B-A22B是性能最强的。据阿里云披露的Qwen3基准测试结果,这款开源模型在代码、数学、通用能力等基准测试中,与一众顶级模型相比极具竞争优势,与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下,甚至有赶超的趋势。

图片

 Qwen3基准测试结果 图源:阿里云

具体来看,比如,在奥数水平的AIME25测评中,千问3取得了81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3得分超过70分,表现优于Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越了OpenAI-o1及DeepSeek-R1。

另外,在评估模型Agent能力的BFCL评测中,Qwen3取得了70.8分的成绩,刷新了该评测的记录,并超越了Gemini2.5-Pro、OpenAI-o1等顶尖模型。

值得一提的是,Qwen3模型还支持全球119种语言和方言,意味着Qwen 3试图开辟更多的国际市场。

不得不说,Qwen3模型的各项表现极为亮眼。当然,如果拿阿里自身来比较,Qwen3模型取得的成绩就理所当然和不足为奇

因为阿里大模型都很能拿得出手,去年6月底,通义千问第二代开源模型Qwen2-72B亮相即登顶。

当时全球著名开源平台Hugging Face(笑脸)的联合创始人兼首席执行官在社交平台透露,通义千问第二代开源模型Qwen2-72B拿下全球开源第一,力压Meta、Mistralai等海外科技巨头。

图片

图源:微博

紧接着今年3月3日,阿里的另一款大模型“万相2.1(Wan2.1)”也取得了优异成绩。

当时开源社区Hugging Face最新榜单显示,阿里大模型“万相2.1(Wan2.1)”登顶模型热榜和模型空间榜,成为近期全球开源社区最受欢迎的大模型。

图片

图源:通义万相Wan公众号

如今,阿里大模型登顶全球最强开源模型,对阿里来说,又是一次重大的技术突破和战略布局。

2、阿里巴巴要全面AI化

阿里大模型能取得如此突破,与阿里在资源上的大力投入密不可分。

在战略层面,阿里巴巴对AI业务的重视提高到了前所未有的高度。在上个月的财报电话会议上,阿里巴巴集团CEO吴泳铭明确指出,阿里巴巴将持续聚焦国内外电商业务、AI+云计算的科技业务、互联网平台产品这三大业务类型。

而对于大模型,吴泳铭强调,未来三年,阿里将围绕AI这个战略核心,在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。

显而易见,阿里巴巴正加速从传统电商公司向AI技术驱动的科技公司转型,这是随着AI战略深入推进的必然结果,也是两年前吴泳铭提出的“用户为先、AI驱动”战略的延续。

要知道过去两年,阿里深受电商低价竞争和市场格局变化的困扰,亟需借助AI的力量来打开新的局面

去年4月正值阿里变革一周年,马云在内部会议上激情澎湃地表示:“AI时代刚刚到来,一切才刚开始,我们正当其时!”

同年12月,在蚂蚁集团20周年庆典上,马云再次现身并分享了他对未来20年AI时代的深刻见解,他强调了AI技术将如何重塑各行各业,并鼓励蚂蚁集团抓住这一历史机遇。

今年4月,马云发表最新演讲,再次大谈AI

显然,马云对AI战略的重视程度非同一般,将其视为阿里巴巴未来发展的核心驱动力。

为支撑这一战略,阿里巴巴在资源投入上展现出惊人魄力。

去年,阿里接连出售银泰百货、大润发、高鑫零售等非核心资产,同时阿里还频繁减持快狗打车、B站、陌陌、网易云音乐等长期亏损的非核心业务。

这些动作背后与其聚焦电商、云计算等核心主业的战略目标息息相关。

除了减轻非核心业务的负担,阿里还加大与云计算有关的AI投入。

比如加大AI人才招聘力度。在3月25日的汇丰全球投资峰会上,阿里巴巴主席蔡崇信表示,经历了几轮裁员之后,阿里的员工数量已经触底了。接下来,阿里将重新开启招聘

紧接着4月,阿里国际随即传出,首次启动一项面向全球的头部AI科技人才培养计划“Bravo 102”,打破传统的校招体系,面试通过后可反选项目和团队。另据阿里国际招聘官网,2026届校招中80%为AI岗位,包括AI算法、研发、AI产品经理等。

图片

图源:阿里国际招聘

今年2月,阿里还挖来全球顶尖AI科学家、前Salesforce副总裁许主洪(Steven Hoi),为AI业务助力。

在资金投入方面,阿里也毫不含糊。吴泳铭直接放话,未来三年,阿里将投入超过3800亿元用于建设云和AI硬件基础设施,总额超过过去十年总和。

这一连串的动作,正在把阿里AI业务推向高潮。

3、互联网大厂掀起新一轮AI大战

AI热潮已经持续了两年,今年年初DeepSeek的横空出世再次引爆了整个AI圈,新一轮的竞赛已然拉开帷幕。无论国内还是国外,各大模型公司都在加速布局,竞相角逐。

当我们聚焦于阿里、抖音、腾讯、百度等国内互联网大厂,他们都以各自的方式铺开业务。

阿里利用开源大模型打开市场,自2023年8月开始,阿里云便开始大规模开源其大模型系列,成为我国首家大规模开源的大厂,并屡获佳绩。

同时,阿里AI业务有了新变化,从过去的侧重面向B端,转而向C端用户倾斜。上个月夸克上线全新功能“AI超级框”,以及通义APP的持续升级改版,都是针对C端用户侧的调整。

AI大模型技术正在快速成熟,应用场景从B端向个人用户扩展,C端用户对AI产品的需求日益多样化,由此,C端市场已成为阿里争夺的新战场。

抖音方面,则选择采取了“广撒网”式的战略打法,先构建起庞大的AI产品矩阵,并采用 “赛马机制”,鼓励内部团队围绕同类产品进行差异化开发。

通过多版本并行测试、数据实时反馈,筛选出最具潜力的产品方向,并快速迭代升级。

自2023 年起,抖音在国内市场加速AI产品的落地节奏。据不完全统计,短短两年间,其在移动端推出近10款AI应用,形成了覆盖聊天、社交、办公、教育、图像、视频、音乐全场景的产品生态。

目前来看,各大互联网公司都力图构建自身的AI护城河,抢占先机,重塑行业竞争格局。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月11日消息,广州人工智能公共算力中心已成功适配并上线了通义最新开源的QwQ-32B推理模型。据了解,QwQ-32B是阿里通义团队最新开源的推理模型,在数学、代码及通用能力的多项权威评测集中,表现与‘满血版’671B的DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型
3月7日消息,全球最大的AI开源社区Hugging Face更新了模型榜单,近日刚发布并开源的阿里通义推理模型QwQ-32B成功登顶。据了解,QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。2023年至今,阿里已向全球开源200多款模型。截至目前,海内外AI开源社区中的模型的衍生模型数量已突破10万,成为全球最大的开源模型族群。
4月15日消息,中国科学院国家天文台人工智能工作组今日发布了新一代天文模型——“星语3.0”。据了解,该模型基于阿里云通义开源模型打造,这是模型在科学领域落地的经典案例,也是模型在天文观测领域的首次应用。
36氪,一位消息人士称,周畅或将投身AI应用领域。
10月31日消息,阿里云旗下模型通义App现已上架各大安卓应用市场,版本号为1.0.2,安装包大小为40.95MB。据介绍,通义App在创意文案方面可提供小红书文案生成、剧本创作、改写润色等功能;办公助理可提供代码生成、代码解释、周报扩写等;学习助手可提供中英互译、数学题、文言文翻译等功能;趣味问答支持高情商回复、吹彩虹屁、健身计划等。
4月7日消息,阿里云通义开源320亿参数模型Qwen1.5-32B。通义此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款语言模型。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,其希望32B开源模型能为企业和开发者提供更高性价比的模型选择。
3月11日消息,旅智科技日前宣布旅智云全面接入DeepSeek、阿里通义等AI模型,成为酒店管理系统领域首个深度整合通用人工智能技术的标杆案例。此次升级后,旅智云将凭借AI深度融合能力,持续进化为“会思考的PMS”,推动酒店数智化转型。根据旅智科技内测数据显示,接入AI模型后,包括订单查询、前台排房、退房等运营流程综合提效50%。
3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
8月3日消息,据36氪,阿里云今日开源通义70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。此举让阿里云成为国内首个加入模型开源行列的大型科技企业。
众安发现,阿里云通义在大部分中文的金融类场景里,准确性方面已经能够超越GPT-3.5,且性能远优于GPT-4。
互联网头条
凝聚百万行业精英,聚焦垂直、前瞻、头条等重磅内容。