搜索

Meesho与印度科学研究所就人工智能等方面达成合作
2023-07-05 15:16:08
7月5日消息，Meesho与印度科学研究所的视觉与人工智能实验室达成了为期一年的产学合作谅解备忘录。作为合作的一部分，Meesho的数据科学家将与IISc的视觉与人工智能实验室的尊敬的研究人员密切合作。他们将共同关注多模态表示学习和生成性人工智能能力，旨在对电子商务领域产生重大影响。研究工作也将有助于开发解决方案，提高Meesho用户的整体电子商务体验。在Meesho，我们拥护这种由新兴技术推动的变革性转变。
百度CTO王海峰: 未来若干年，规模定律仍然有效
2025-01-20 15:19:59
1月20日消息，百度首席技术官、国家卓越工程师王海峰表示，未来若干年，规模定律（Scaling Law）仍然有效。一方面，更高质量更大规模的数据、更大的模型将会带来更强的能力；另一方面，大语言模型仍有提升空间，多模态大模型也会越来越好用，越来越实用。
饿了么骑手AI助手“小饿”已全国上线
2025-06-24 10:10:26
6月24日消息，饿了么骑手AI助手“小饿”已在全国上线。也就是说，即日起，全国数百万众包蓝骑士都有了自己的智能AI助手。AI“小饿”是国内首个面向外卖小哥的AI服务工具，今年4月开始在四个城市试点。AI“小饿”基于大模型技术，依托自然语言处理、多模态交互及实时数据分析能力，通过语音交互与智能响应，为骑手提供全阶段、多维度的系统陪伴和辅助服务，从接单到完单全面覆盖骑手的外卖配送场景。
腾讯云与杭州德适生物合作聚焦医学影像智能化升级
2025-03-21 10:21:09
3月21日消息，腾讯云近日与杭州德适生物正式签署战略合作协议，双方将围绕医学影像智能化升级与医疗健康精准化服务，整合腾讯觅影开放实验平台、影像AI能力与德适iMedImage大模型，打造多影像模态智能中枢系统。德适和腾讯还将通过微信、腾讯健康等数字化连接平台，构建"设备+服务+数据"的创新商业模式，共同推进医学影像AI训练标准与数据安全标准。
阿里巴巴多模态对话专利公布可丰富人机对话方式
2023-03-25 17:28:15
阿里巴巴达摩院（杭州）科技有限公司日前公开一项“多模态对话方法、装置、设备及存储介质”专利。
阿里巴巴多模态对话专利公布可丰富人机对话方式
2023-03-25 17:02:20
3月25日消息，天眼查资料显示，3月24日，阿里巴巴达摩院科技有限公司申请的“多模态对话方法、装置、设备及存储介质”专利公布。该申请使得用户可以通过多种模态信息对同一问题和该问题针对的目标对象进行描述，使得人机对话系统可以从多个模态理解同一问题，并生成一个或多个回复信息，如果是多个回复信息，则多个回复信息的模态不同，从而实现了多模态对话，使得用户和人机对话系统之间的对话方式灵活多样，提高了用户体验。
蚂蚁集团推出20亿参数多模态遥感基础模型SkySense
2024-02-28 12:05:55
蚂蚁集团多模态研究成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
字节跳动开源多模态AI Agent—UI-TARS-1.5
2025-04-23 10:21:12
4月23日消息，字节跳动开源了多模态AI Agent UI-TARS的最新1.5版本。与上一代相比，1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。
快手发布全新多模态大模型Kwai Keye-VL
2025-06-26 15:34:06
6月26日消息，快手发布全新多模态大模型Kwai Keye-VL，该模型在视频理解方面表现出色，能够将视频内容转化为高效的解决方案，并且能够智能选择思考模式，兼顾效率与创意。除了在复杂视觉感知和视频理解上的优异表现，Kwai Keye-VL在逻辑推理方面同样令人惊喜，尤其在2025年高考全国数学卷中取得了140分的高分。目前，Kwai Keye-VL已正式开源，为开发者和研究人员提供了强大的工具和支持。
阿里联合清华大学发布中文多模态预训练AI模型M6
2021-03-03 10:06:52
3月3日消息，阿里巴巴与清华大学联合发布中文多模态预训练AI模型M6。据介绍，预训练语言模型是让AI具备认知能力的关键技术，此次发布的M6模型参数规模达到1000亿，其理解和生成能力超越传统AI。《电商报》获悉，日前，阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力，还可基于常识实现AI创作，未来将应用于文本理解、人机交互、视觉问答等场景。
360孙浩：结合物联网的多模态大模型将是下一个风口
2023-06-05 11:43:53
针对360智慧生活的相关话题，360视觉云业务线总经理孙浩发表了自己的观点。
余承东：华为P60引入多模态大模型技术可实现智慧搜图
2023-03-23 17:46:55
3月23日消息，华为任余承东介绍，华为带来全新智慧搜图功能，基于多模态大模型技术，在手机端侧对模型进行小型化处理，在业界率先实现了首创的、精准的自然语言手机图库搜索体验。智慧搜图功能将于2023年5月陆续上线，支持搭载HarmonyOS 3.1及以上版本的手机或平板电脑。
腾讯AI聊天专利可多模态回复消息
2023-04-07 15:44:35
4月7日消息，天眼查App显示，4月7日，腾讯科技有限公司申请的“一种智能互动方法、装置、计算机设备和存储介质”专利获授权。本申请可以在对话过程中，用文本搭配多模态内容等来回复用户，丰富了虚拟用户与用户的对话形式，极大地增加了聊天的趣味性和对用户的吸引力。
阿里云开源通义千问多模态大模型Qwen-VL
2023-08-25 11:47:09
8月25日消息，阿里云今日推出大规模视觉语言模型Qwen-VL，并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入。相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力，可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
齐心集团：公司目前暂未投入多模态技术研发
2023-12-13 09:37:19
12月13日消息，齐心集团近日在互动平台表示：公司目前暂未投入多模态技术研发，公司十分注重前沿技术的发展及应用，将密切关注新技术、新趋势的发展。
消息称字节跳动正秘密研发多模态数字人等多个AI产品
2024-02-29 09:18:13
2月29日消息，据报道，字节跳动正在AI大模型领域秘密研发多个产品，其中包括多模态数字人产品以及AI生图、AI生视频产品等。一位知情人士透露，其在去年下半年见到了字节跳动多模态数字人产品的demo，整体感觉还不错。另据了解，字节跳动旗下剪映已在数月前组建封闭团队，秘密研发AI产品。目前，该团队仍处于严格保密阶段，研发的产品还未上线。对此消息，字节跳动方面尚未回应。
钉钉AI助理升级加入多模态、工作流等能力
2024-03-28 14:17:58
3月28日消息，钉钉AI助理升级，上线图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力，甚至可以通过多轮交互进一步做智能问答。
字节跳动将上线全新多模态视频生成模型
2025-02-07 18:00:20
2月7日消息，字节跳动旗下一站式AI创作平台即梦AI将上线多模态视频生成模型OmniHuman，仅需一张图片与一段音频便可生成一条AI视频，该模型为字节自研闭源模型。即梦AI相关负责人透露，该模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。
李彦宏：DeepSeek不是万能的，多模态才是未来基础模型的标配
2025-04-26 11:43:49
李彦宏称，DeepSeek只能处理单一的文本，还不能理解声音、图片、视频等多媒体内容。
李彦宏：DeepSeek不是万能的，多模态才是未来基础模型的标配
2025-04-26 11:44:46
4月26日消息，Create2025百度AI开发者大会日前在武汉举办，百度创始人李彦宏发表了题为《模型的世界应用的天下》的演讲。谈到DeepSeek，李彦宏称，百度各个业务线第一时间接入了DeepSeek，但DeepSeek也不是万能的，它只能处理单一的文本，还不能理解声音、图片、视频等多媒体内容，同时幻觉率比较高，很多场合不能放心使用。“它最大的问题是慢和贵，中国市场上绝大多数大模型API的价格都更低，而且反应速度更快。”