首页
快讯
观察
Toggle theme
阿里达摩院在机器
视觉
问答
VQA榜单中首次超越人类
2021-08-12 11:00:33
8月12日消息,在国际权威机器
视觉
问答
榜单VQA Leaderboard上,阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。
阿里巴巴
视觉
算法团队斩获16项CVPR冠军
2021-06-28 15:25:07
6月28日消息,计算机
视觉
领域顶级会议CVPR 2021竞赛结果已全部揭晓,阿里巴巴达摩院
视觉
实验室、手淘算法等团队参与了多项高难度
视觉
任务竞赛,共斩获16项世界冠军,覆盖图像及视频内容理解、遥感影像分析、
视觉
问答
等场景,多项研究可帮助盲人感知物理世界、识别农业领域灾害等。值得一提的是,近日,阿里巴巴授予5位达摩院科学家和3个团队“达摩奖”,这是阿里巴巴最高科技荣誉。
阿里联合清华大学发布中文多模态预训练AI模型M6
2021-03-03 10:06:52
3月3日消息,阿里巴巴与清华大学联合发布中文多模态预训练AI模型M6。据介绍,预训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、
视觉
问答
等场景。
阿里巴巴、智源研究院等联合发布预训练AI模型 “文汇”
2021-01-12 11:58:42
1月12日消息,日前,阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”,旨在探索解决当前大规模自监督预训练模型不具有认知能力的问题。“文汇”也是目前我国规模最大的预训练模型。据了解,该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、
视觉
问答
等场景。
阿里云推出大规模
视觉
语言模型Qwen-VL
2023-08-26 17:43:22
8月26日消息,阿里云推出大规模
视觉
语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。Qwen-VL是支持中英文等多种语言的
视觉
语言模型,相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、
问答
及对话能力之外,还新增了
视觉
定位、图像中文字理解等能力。
脉脉林凡:文字
问答
一定不是大模型时代的产品形态
2023-12-13 10:30:56
12月13日消息,脉脉创始人兼CEO林凡出席中国企业领袖年会。林凡在演讲中表示,未来人才供应和需求之间的匹配会发生巨大变化,在机会减少的情况下,职场人会更加重视人脉的经营和个人品牌的打造,他还官宣即将上线全新社交产品。另外,他认为,随着AI大模型时代的到来,社交产品的交互界面逐渐被颠覆,文字
问答
一定不是大模型时代的产品形态,未来的交互可能是对话或语音为基础,甚至是
视觉
形象的语音
问答
。
阿里云开源通义千问多模态大模型Qwen-VL
2023-08-25 11:47:09
8月25日消息,阿里云今日推出大规模
视觉
语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、
问答
及对话能力之外,还新增了
视觉
定位、图像中文字理解等能力,可用于知识
问答
、图像标题生成、图像
问答
、文档
问答
、细粒度
视觉
定位等场景。
百度CTO王海峰:文心一言落地水到渠成,带来三大产业机会
2023-04-03 16:40:16
中国电子学会副理事长、百度首席技术官王海峰出席主论坛并做报告,阐释了大模型技术发展与产业模式。王海峰展示了文心一言的对话
问答
、文学创作、多模态生成等能力。王海峰表示,新一代知识增强大语言模型文心一言是百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕预训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、
视觉
、跨模态、生物计算等大模型。
钉钉AI助理升级 加入多模态、工作流等能力
2024-03-28 14:17:58
3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的
视觉
推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能
问答
。
视觉
中国推出视觉艺术数字藏品平台“元
视觉
”
2021-12-27 11:34:32
昨日,
视觉
中国官微发布公告称,
视觉
中国打造的视觉艺术数字藏品平台——元
视觉
官方网站及小程序(元
视觉
藏品)上线。
视觉
中国推出视觉艺术数字藏品平台“元
视觉
”
2021-12-27 11:58:03
12月27日消息,日前,
视觉
中国宣布其打造的视觉艺术数字藏品平台——元
视觉
官方网站及小程序 正式上线,这标志着
视觉
中国“区块链+”战略正式落地,正式进入2C的数字藏品赛道。
视觉
中国:元
视觉
平台目前还在上线初期摸索阶段
2021-12-29 08:58:58
12月29日消息,昨日,针对此前推出视觉艺术数字藏品平台“元
视觉
”一事,
视觉
中国表示,元
视觉
平台目前还在上线初期的摸索阶段。公司的优势是储备了大量内容,可以安排上线的内容较丰富,会根据市场反应等情况随时调整。目前计划每周都有上新,2022年一季度的数字藏品上线计划已经初步排好。
阿里巴巴
视觉
算法团队斩获16项CVPR冠军
2021-06-28 16:16:26
计算机
视觉
领域顶级会议CVPR 2021竞赛结果今日全部揭晓,阿里巴巴
视觉
算法团队共斩获16项世界冠军。
小米参投法国AI
视觉
公司普诺飞思C轮融资
2021-07-06 15:44:02
法国神经拟态
视觉
公司普诺飞思(Prophesee)近期宣布完成数千万美元C轮融资。该轮融资由创新工场领投,小米及上海韦豪创芯参投,数家老股东继续加码。
阿里巴巴公开“
视觉
设计投放方法及装置”专利
2021-09-03 11:42:32
阿里巴巴(中国)有限公司9月3日公开一项“
视觉
设计投放方法及装置”专利。
传字节跳动
视觉
技术负责人王长虎已离职
2021-10-11 09:27:56
字节跳动的
视觉
技术负责人王长虎已于近期离职。
美团公开“
视觉
定位方法”专利
2021-11-08 10:40:35
美团关联公司北京三快在线科技有限公司11月5日公开一项“一种
视觉
定位方法及装置”专利。
美团公开“车载
视觉
采集模组及无人车”专利
2021-11-10 11:27:52
美团关联公司北京三快在线科技有限公司11月9日公开一项“车载
视觉
采集模组及无人车”专利。
美团公开“车载
视觉
采集装置和无人车”专利
2022-01-12 11:18:51
美团公开一项“车载
视觉
采集装置和无人车”专利。
华为洪方明:华为机器
视觉
军团战略升级
2022-08-09 14:17:43
日前,华为机器
视觉
产业峰会暨新品发布会2022在延安举办。
‹‹
‹
1
2
›
››