阿里达摩院公开“图像中的文本识别方法、装置”专利

云合 2022-03-18 11:50:35
行业观察 2022-03-18 11:50:35 阅读 1416 评论 0

3月18日消息,天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司3月18日公开一项“图像中的文本识别方法、装置、设备及存储介质”专利,申请公布号为CN114202647A,申请日期为2022年2月16日。

format-jpg

该专利摘要显示,本公开涉及一种图像中的文本识别方法、装置、设备及存储介质。本公开通过获取目标图像,并确定该目标图像中包含至少一行文本的子图像。进一步,将所述子图像、以及所述至少一行文本中的每个字符输入多模态模型,由于子图像含有较为直观且准确的信息,从而使得多模态模型的输入中增加了原始视觉信息,使得多模态模型可以根据子图像对文本标注任务进行增强和指导,从而使得多模态模型可以确定出每个字符较为准确的标签。

进一步,根据每个字符的标签可以对该至少一行文本进行准确的断句,尤其是对有歧义的文本行的断句处理效果较好,避免将图像中的多段文本识别为一段文本,以及避免后续的文本理解或处理出错。

format-jpg

format-jpg

近日,阿里巴巴达摩院(杭州)科技有限公司还公开“测试器件以及采用测试器件进行测试的测试方法”、“主题词确定方法、设备及存储介质”、“文本识别方法、图像矫正方法、电子设备和存储介质”等多项专利。

天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人为周明,注册资本1000万人民币,经营范围包括:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;专业设计服务;翻译服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。

format-jpg

股权穿透图显示,阿里巴巴达摩院(杭州)科技有限公司由阿里巴巴(中国)有限公司全资持股,认缴金额1000万人民币。

format-jpg

声明:
  1. 该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
  2. 电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
  3. 如对本稿件有异议或投诉,请联系:info@dsb.cn
请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
讨论数量: 0
暂无评论