1. 今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入训练对话模型,在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果。
  2. 12月1日消息,在通义千问发布会上,阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。据悉,阿里云本次开源的模型中除训练模型外,还同步推出了对应的对话模型,面向72B、1.8B对话模型提供了4bit/8bit量化版模型,便于开发者们推理训练
  3. 8月10日消息,日前,中文语言理解测评基准 阅读理解排行榜显示,蚂蚁集团保险科技团队的AntInsBert模型以92.475的得分,打破了CLUE阅读理解榜的历史纪录,排名第一。据悉,凭借多年来在自然语言处理方面的深耕,蚂蚁保险科技团队自主研发了训练语言模型——AntInsBert。此前,在第11届CCF自然语言处理与中文计算会议上,蚂蚁集团保险科技团队凭借多年来在保险领域对话理解的技术积累,获得“细粒度对话社会偏见识别”评测任务第一名。
  4. 10月19日消息,腾讯AI大模型产品混元助手已经开始对外测试,用户在获得测试资格后将可以正式使用。腾讯混元助手是由腾讯研发的大语言模型的平台产品,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。今年9月,混元大模型参数规模超干亿,训练语料超2万亿tokens,已经在腾讯云、腾讯广告、微信搜一搜等多个腾讯内部业务和产品经过测试。
  5. 7月20日消息,拉勾招聘宣布上线AI智能招聘助手产品“HRMind”,这是在招聘行业内首个基于训练模型实现广泛应用的招聘场景产品。据介绍,HRMind可处理对话聊天、智能问答等多轮交互沟通。未来,该产品还将实现帮助HR模拟面试、分析求职者简历等功能。
  6. 2月20日消息,猎聘大数据研究院推出《ChatGPT相关领域就业洞察报告》,解析人工智能领域的就业趋势,以及与ChatGPT密切相关的三个分支领域——训练模型对话机器人和AIGC 的人才需求情况。数据显示,猎聘大数据研究院以2018一季度为参照点(基数),此后至2022年,以各季度的人工智能、互联网新发职位数与2018一季度新发职位数相除得到结果:五年来,互联网人才需求增长趋势平缓,人工智能人才需求在2020年之后整体迅速上升。
  7. 中国电子学会副理事长、百度首席技术官王海峰出席主论坛并做报告,阐释了大模型技术发展与产业模式。王海峰展示了文心一言的对话问答、文学创作、多模态生成等能力。王海峰表示,新一代知识增强大语言模型文心一言是百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型
  8. 2月7日消息,多家知名互联网公司近日纷纷公布人机对话相关专利。其中,腾讯科技(深圳)有限公司申请的“人机对话方法、装置、设备及计算机可读存储介质”专利可实现人机顺畅沟通;阿里巴巴达摩院(杭州)科技有限公司申请的“人机对话及训练语言模型训练方法、系统及电子设备”专利可提升问答交互的准确性;华为技术有限公司申请的“人机对话方法以及对话系统”专利可识别用户异常行为进行回复。
  9. 阿里巴巴达摩院公开一项“训练语言模型的训练方法、装置、计算机设备和介质”专利。
  10. 阿里巴巴达摩院公开一项“训练服务系统及基于训练服务系统的服务提供方法”专利。
  11. 6月14日消息,腾讯RoboticsX机器人实验室公布了智能体研究的最新进展,通过将前沿的训练AI模型和强化学习技术应用到机器人控制领域,让腾讯机器狗Max的灵活性和自主决策能力得到大幅提升。
  12. 6月15日消息,搜狗创始人王小川创立的百川智能公司,宣布推出了70亿参数量的中英文训练模型——baichuan-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。据介绍,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。
  13. 3月3日消息,阿里巴巴与清华大学联合发布中文多模态训练AI模型M6。据介绍,训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
  14. 滴滴关联公司北京嘀嘀无限科技发展有限公司9月3日公开一项“音频数据的训练模型训练方法、装置、设备及介质”专利。
  15. 今天,阿里巴巴达摩院深度语言模型体系AliceMind发布中文社区首个表格训练模型SDCUP。
  16. 11月8日消息,今日,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI训练模型。同时,M6做到了业内极致的低碳高效,使用512 GPU在10天内即可训练出具有可用水平的10万亿模型。相比去年发布的大模型GPT-3,M6实现同等参数规模的能耗仅为其1%。
  17. 1月12日消息,日前,阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型训练模型“文汇”,旨在探索解决当前大规模自监督训练模型不具有认知能力的问题。“文汇”也是目前我国规模最大的训练模型。据了解,该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
  18. 8月8日消息,天眼查App显示,近日,网之易信息技术 有限公司申请注册“网易言”商标,国际分类为网站服务,当前商标进度为申请中。据此前媒体报道,“言”为网易伏羲实验室推出的中文训练模型,其相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
  19. 网易目前已自研数十个超大规模训练模型,覆盖自然语言等多种模型领域。
  20. 9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模训练模型”主题论坛。