腾讯混元宣布开源首个多模态统一CoT奖励模型

2025-05-14 09:31:26

5月14日消息，腾讯混元近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think，构建出首个具备长链式推理能力的统一多模态奖励模型，首次让奖励模型在各视觉任务上真正“学会思考”，实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前，该项目已全面开源，包括模型、数据集、训练脚本与评测工具。

[查看原文]

更加详细情况，请关注本站最新动态。

7X24h快讯

CoGoLinks结行国际上线Shopee巴西本土店收款
14分钟前
大健云仓获2025年美国商业奖
24分钟前
爱沙尼亚邮政集团Omniva去年收入1.414亿欧元
30分钟前
2025年天津目标实现跨境电商进出口额650亿元
37分钟前
中信里昂：上调对小米集团今年电动车销售预测至40万辆
41分钟前
美团在苏州成立海骑科技公司注册资本2000万美元
54分钟前
饿了么全量上线小饿评审团、限制恶意用户下单等功能
56分钟前
Shopee一季度GMV达286亿美元同比增长21.5%
56分钟前
TikTok推出全新图像转视频工具TikTok AI Alive
59分钟前
京东上线“胖东来甄选”商品
1小时前