搜索

阿里达摩院在机器视觉问答VQA榜单中首次超越人类
2021-08-12 11:00:33
8月12日消息，在国际权威机器视觉问答榜单VQA Leaderboard上，阿里巴巴达摩院以81.26%的准确率创造了新纪录，让AI在“读图会意”上首次超越人类基准。
阿里巴巴视觉算法团队斩获16项CVPR冠军
2021-06-28 15:25:07
6月28日消息，计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓，阿里巴巴达摩院视觉实验室、手淘算法等团队参与了多项高难度视觉任务竞赛，共斩获16项世界冠军，覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景，多项研究可帮助盲人感知物理世界、识别农业领域灾害等。值得一提的是，近日，阿里巴巴授予5位达摩院科学家和3个团队“达摩奖”，这是阿里巴巴最高科技荣誉。
阿里联合清华大学发布中文多模态预训练AI模型M6
2021-03-03 10:06:52
3月3日消息，阿里巴巴与清华大学联合发布中文多模态预训练AI模型M6。据介绍，预训练语言模型是让AI具备认知能力的关键技术，此次发布的M6模型参数规模达到1000亿，其理解和生成能力超越传统AI。《电商报》获悉，日前，阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力，还可基于常识实现AI创作，未来将应用于文本理解、人机交互、视觉问答等场景。
阿里巴巴、智源研究院等联合发布预训练AI模型 “文汇”
2021-01-12 11:58:42
1月12日消息，日前，阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”，旨在探索解决当前大规模自监督预训练模型不具有认知能力的问题。“文汇”也是目前我国规模最大的预训练模型。据了解，该模型不仅能提升AI的理解能力，还可基于常识实现AI创作，未来将应用于文本理解、人机交互、视觉问答等场景。
阿里云推出大规模视觉语言模型Qwen-VL
2023-08-26 17:43:22
8月26日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规模通用模型的表现。Qwen-VL是支持中英文等多种语言的视觉语言模型，相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。
脉脉林凡：文字问答一定不是大模型时代的产品形态
2023-12-13 10:30:56
12月13日消息，脉脉创始人兼CEO林凡出席中国企业领袖年会。林凡在演讲中表示，未来人才供应和需求之间的匹配会发生巨大变化，在机会减少的情况下，职场人会更加重视人脉的经营和个人品牌的打造，他还官宣即将上线全新社交产品。另外，他认为，随着AI大模型时代的到来，社交产品的交互界面逐渐被颠覆，文字问答一定不是大模型时代的产品形态，未来的交互可能是对话或语音为基础，甚至是视觉形象的语音问答。
阿里云开源通义千问多模态大模型Qwen-VL
2023-08-25 11:47:09
8月25日消息，阿里云今日推出大规模视觉语言模型Qwen-VL，并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入。相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力，可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
百度CTO王海峰：文心一言落地水到渠成，带来三大产业机会
2023-04-03 16:40:16
中国电子学会副理事长、百度首席技术官王海峰出席主论坛并做报告，阐释了大模型技术发展与产业模式。王海峰展示了文心一言的对话问答、文学创作、多模态生成等能力。王海峰表示，新一代知识增强大语言模型文心一言是百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕预训练模型研发，经过近4年积累和迭代，文心大模型已经形成了系统性的大模型技术体系，包括自然语言处理、视觉、跨模态、生物计算等大模型。
钉钉AI助理升级加入多模态、工作流等能力
2024-03-28 14:17:58
3月28日消息，钉钉AI助理升级，上线图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力，甚至可以通过多轮交互进一步做智能问答。
视觉中国推出视觉艺术数字藏品平台“元视觉”
2021-12-27 11:34:32
昨日，视觉中国官微发布公告称，视觉中国打造的视觉艺术数字藏品平台——元视觉官方网站及小程序（元视觉藏品）上线。
视觉中国推出视觉艺术数字藏品平台“元视觉”
2021-12-27 11:58:03
12月27日消息，日前，视觉中国宣布其打造的视觉艺术数字藏品平台——元视觉官方网站及小程序正式上线，这标志着视觉中国“区块链+”战略正式落地，正式进入2C的数字藏品赛道。
视觉中国：元视觉平台目前还在上线初期摸索阶段
2021-12-29 08:58:58
12月29日消息，昨日，针对此前推出视觉艺术数字藏品平台“元视觉”一事，视觉中国表示，元视觉平台目前还在上线初期的摸索阶段。公司的优势是储备了大量内容，可以安排上线的内容较丰富，会根据市场反应等情况随时调整。目前计划每周都有上新，2022年一季度的数字藏品上线计划已经初步排好。
阿里巴巴视觉算法团队斩获16项CVPR冠军
2021-06-28 16:16:26
计算机视觉领域顶级会议CVPR 2021竞赛结果今日全部揭晓，阿里巴巴视觉算法团队共斩获16项世界冠军。
小米参投法国AI视觉公司普诺飞思C轮融资
2021-07-06 15:44:02
法国神经拟态视觉公司普诺飞思（Prophesee）近期宣布完成数千万美元C轮融资。该轮融资由创新工场领投，小米及上海韦豪创芯参投，数家老股东继续加码。
阿里巴巴公开“视觉设计投放方法及装置”专利
2021-09-03 11:42:32
阿里巴巴（中国）有限公司9月3日公开一项“视觉设计投放方法及装置”专利。
传字节跳动视觉技术负责人王长虎已离职
2021-10-11 09:27:56
字节跳动的视觉技术负责人王长虎已于近期离职。
美团公开“视觉定位方法”专利
2021-11-08 10:40:35
美团关联公司北京三快在线科技有限公司11月5日公开一项“一种视觉定位方法及装置”专利。
美团公开“车载视觉采集模组及无人车”专利
2021-11-10 11:27:52
美团关联公司北京三快在线科技有限公司11月9日公开一项“车载视觉采集模组及无人车”专利。
美团公开“车载视觉采集装置和无人车”专利
2022-01-12 11:18:51
美团公开一项“车载视觉采集装置和无人车”专利。
华为洪方明：华为机器视觉军团战略升级
2022-08-09 14:17:43
日前，华为机器视觉产业峰会暨新品发布会2022在延安举办。