阿里巴巴联合中科院研发AI“听音识人”

王小孟 2021-03-25 09:36:06
行业观察 2021-03-25 09:36:06 阅读 1425 评论 0

3月25日消息,阿里巴巴联手中科院,实现AI“听音识人”。通过训练AI模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,AI将为该声音找到“主人”。经验证明,准确率达到90%。在“1对N”的匹配实验中,AI还能对声音归属人脸的“可能性”进行排序。

值得一提的是,在2020云栖大会上,阿里达摩院曾公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。

据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。

彼时,达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用,正全面对外开放。

声明:
  1. 该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
  2. 电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
  3. 如对本稿件有异议或投诉,请联系:info@dsb.cn
请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
讨论数量: 0
暂无评论