阿里Qwen团队发布新推模型QwQ预览版

田宁
2025-02-25 14:09

2月25日消息,阿里Qwen团队在社交媒体发布了深度思考模型Thinking(QwQ)预览版。这是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型。QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。此外,该团队宣布,QWQ-MAX正式版本即将发布,Android和iOS应用程序也会同步发布。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
11月21日消息,Qwen2.5-Turbo上线阿里云百炼平台,模型上下文长度扩展至百万tokens。据介绍,Qwen2.5-Turbo是通义千问团队回应社区对处理更长序列的需求推出的全新版本模型。该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字。
他表示,阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为的王者,中国在全球开源大模型领域处于领导地位。
2月25日消息,根据全球最大AI开源社区HuggingFace最新显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万,持续领先美国Llama等开源模型,稳居全球最大开源模型榜首。
2月1日消息,阿里云近日发布百炼qwen-max系列模型价格调整通知,qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型输入输出价格调整,qwen-max batch和cache同步降价。
1月26日消息,阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩。
8月26日消息,阿里云推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。Qwen-VL是支持中英文等多种语言的视觉语言模型,相较于此前的VL模型Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。
9月25日消息,阿里云智能首席技术官周靖人在通义千问开源发布会上宣布,将全新开源性能更强的大模型Qwen-14B,该模型基于140亿参数,3万亿token训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,QWEN-7B模型能力普遍提升,核心指标最高提升22.5%。
田宁
电商脉搏,媒体前沿洞察。