小米公开识别媒体文件中人声配音类型相关专利

宋妤 2021-10-19 17:05:12
零售 2021-10-19 17:05:12 阅读 1248 评论 0

10月19日消息,天眼查信息显示,今天,北京小米移动软件有限公司公开“识别媒体文件中人声配音类型的方法、装置及存储介质”专利,申请公布号为CN113516154A,申请日期为2021年4月。

format-jpg

专利摘要显示,本公开是关于一种识别媒体文件中人声配音类型的方法、装置及存储介质。一种识别媒体文件中人声配音类型的方法,包括:获取待识别的媒体文件,媒体文件至少包括音频数据,音频数据至少包括人声配音数据。基于预先训练得到的类型识别模型,确定人声配音数据中的人声配音的配音类型,配音类型包括真实人声和模拟人声。

通过本公开提供的识别媒体文件中人声配音类型的方法,能够通过预先训练得到的类型识别模型将媒体文件中人声配音数据中的人声配音进行识别,进而确定该人声配音的配音类型属于真实人声还是模拟人声,从而提高音频分类的辨识度,解决无法有效分辨人声配音的配音类型的问题。

format-jpg

信息显示,北京小米移动软件有限公司成立于2012年5月8日,注册资本为148800万人民币,法定代表人为王川,经营范围包括计算机系统服务;设计、制作、代理、发布广告;承办展览展示活动;市场调查;货物进出口、技术进出口、代理进出口等。

专利信息显示,近日,该公司还公开了“屏幕显示的方法及装置”、“智能设备的操作方法、装置及存储介质”、“智能设备的管理方法、装置及存储介质”等专利。

format-jpg

声明:
  1. 该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
  2. 电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
  3. 如对本稿件有异议或投诉,请联系:info@dsb.cn
请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
讨论数量: 0
暂无评论