阿里研发AI技术0.15秒识别拦截外语脏话图

田宁

2021-09-27 15:03

9月27日消息，阿里安全算法团队宣布，其研发用于网络脏话的AI（OCR）技术，已能识别近30种语言，包括嵌入图片中的英文、阿拉伯、俄语、法语、西语、日语、韩语、泰语、越南语、波斯语、孟加拉、尼泊尔、僧伽罗、朝鲜、苏丹、德语、荷兰语，以及马来语、塔加洛语、土耳其语、意大利语、印尼语等国语言，甚至还包括三种中国少数民族语言。

format-jpg

据了解，在部分国际平台中，“买家”在商品评论中以英语评论图骂人，或者在交互场景中，买卖双方以俄语脏话图片对阵。国际平台风控团队和算法团队复盘了很多案例，发现除了多语种脏话，多语种垃圾广告以及不良信息也会暗藏在图片中，试图对抗风控。

阿里安全高级算法工程师沄帆介绍，要识别多语种文字，就要了解各个语言文字特点，以及影响算法识别的问题。每种文字体系都有自己的字体，不同字体会导致同一字符出现字形上的差异，相同的单词在不同的语种里也可能有不同的含义。

format-jpg

除此之外，还有脏话图以置换正常字符顺序，对抗风控的情况出现，即使调换字符顺序，人还是可以轻而易举地判断单词的含义，但这种“攻击”试图以打乱字母顺序的方式骗过机器识别。

通过一年多努力研究，阿里安全算法团队对这些点进行了逐个突破，通过改进多语言样本生成方案与多语种识别模型框架，在多种图片语言的识别上做到了高识别率，以及做到识别1张脏话图只需0.15秒的速度。

目前该技术也已应用在阿里多项国际业务中，总体识别准确率可达95%以上，并对各种艺术字体、复杂背景以及手写图进行了针对性识别优化。

format-jpg

阿里巴巴阿里云 AI（OCR）技术

声明

1、该内容为作者独立观点，不代表电商派观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、电商号平台仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。
3、如对本稿件有异议或投诉，请联系：info@dsb.cn

相关阅读

Gartner报告：阿里云语言AI领域排名第二

2022-07-07 15:34:11

近日，国际权威研究机构Gartner公布《云AI开发者服务关键能力报告》，报告显示，在语言AI领域，阿里巴巴排名第二。

阿里云张勇：AI云服务需求非常旺盛

2023-08-11 10:18:32

8月11日消息，阿里巴巴集团日前公布新一季度业绩，阿里云收入增长4%至251.23亿元，阿里巴巴集团董事会主席兼CEO、阿里云智能集团董事长兼CEO张勇表示，新一代人工智能发展带来的模型训练和推理场景，对AI云服务的需求非常旺盛，但是由于短期内GPU在中国市场供应的紧缺，使得这样的需求只得到了部分满足，AI相关服务所带来的增量机会刚刚开始得到释放。

阿里云官宣成为2025年春晚云计算AI独家合作伙伴

2024-12-26 11:51:48

12月26日消息，阿里云官宣成为2025年央视春晚云计算AI独家合作伙伴，将支持全球华人云上看春晚，这是央视春晚史上首次引入技术合作伙伴。12月2日，中央广播电视总台在北京举办了2025年春晚版权文创与广告合作签约发布会。在此次活动现场，阿里巴巴宣布成为2025年央视春晚独家电商互动平台。

中金：维持阿里巴巴“跑赢行业”评级，目标价为109港元

2024-09-20 16:06:56

9月20日消息，中金发布研究报告称，维持阿里巴巴-SW“跑赢行业”评级，目标价109港元。管理层在阿里云栖大会上表示，看好生成式AI的发展，认为数位世界与物理世界会逐步被AI重塑，其中自动驾驶和机械人产业是重要应用。中金指，阿里云致力AI时代实现云计算体系全面升级，相信其可通过“一云多芯”等技术创新，弥补供给短板，更能彰显领先的云厂商价值。

阿里巴巴第一财季营收2432.4亿元同比增长4%

2024-08-15 19:02:30

8月15日消息，阿里巴巴发布2024年六月底止季度财报。该季度阿里巴巴收入2432.36亿元，同比增长4%；归属于普通股股东的净利润为242.69亿元，净利润为240.22亿元，同比下降27%。电商、云两大核心业务继续取得积极进展：淘天集团线上GMV保持稳定增长，阿里云聚焦“公共云+AI”，公共云业务收入双位数增长、AI相关产品收入三位数增长。

阿里云将在日本推广生成式AI商业提案

2025-03-06 14:58:07

3月6日消息，阿里巴巴旗下的阿里云宣布将面向日本企业推广基于生成式AI基础模型的商业提案，并与当地咨询公司和系统开发公司合作。阿里云日本服务公司的区域总经理与谢野正宇表示，计划在未来三年内将使用该公司模型的项目增加到1000个以上。

阿里云发布统一AI平台“阿里灵杰”

2021-10-20 17:49:22

10月20日消息，在2021云栖大会上，阿里巴巴集团副总裁、阿里云计算平台事业部负责人贾扬清发布统一AI平台“阿里灵杰”，集成阿里整体AI能力对外开放，开发者可“开箱即用”。同时阿里云还首次提出AI平台的“4S”标准，为人工智能行业发展提供借鉴。据透露，基于“阿里灵杰”的分布式训练优化技术，达摩院多模态大模型M6已升级至全球首个突破10万亿参数的AI模型，规模超越此前谷歌发布的1.6万亿Switch Transformer模型。

阿里云张勇：AI时代会出现新的领军企业，一个新的生态正在形成

2023-08-29 11:46:43

8月29日消息，在德勤中国全国合伙人大会上，阿里巴巴集团董事会主席兼CEO、阿里云智能集团董事长兼CEO张勇谈道，AI时代一定会出现新的领军企业，是全新生态形成的过程。新一代AI将在两个层面带来极大改变，一方面对企业来说，AI将极大提升生产力和效率，另一方面对用户来说，有可能出现下一代搜索、社区等新物种的爆发。

阿里“少年云助学计划”已为全国乡村学校建设300所AI云教室

2025-04-24 10:44:09

4月24日消息，在“教育数字化2.0”战略全面推进的背景下，阿里巴巴宣布“少年云助学计划”已为全国乡村学校建设300所AI云教室，惠及25万师生，这一数字教育普惠工程，正依托AI大模型、云计算等技术，通过云端算力与人工智能的深度融合，为教育公平注入科技动能。

AI驱动阿里云重回增长，季度营收达251亿

2023-08-10 18:59:25

阿里巴巴集团公布新一季度业绩，阿里云收入增长4%至251.23亿元，经调整EBITA利润增长106%至3.87亿元。AI热潮带来的算力和模型服务需求，正在推动阿里云重回增长。

田宁

电商脉搏，媒体前沿洞察。