阿里妈妈图像识别刷新世界最好成绩,识别虚假推广信息准确率超95%

简介: 阿里妈妈图像团队的OCR(图中文字识别)技术刷新了ICDAR Robust Reading竞赛数据集的全球最好成绩,并大幅超越第二名。

 

日前,阿里妈妈图像团队的OCR(图中文字识别)技术刷新了ICDAR Robust Reading竞赛数据集的全球最好成绩,并大幅超越第二名。Robust Reading竞赛是当前OCR技术领域全球最具影响力的比赛。这也是继阿里巴巴图像搜索领军人物华先胜获得ACM(美国计算机协会)“杰出科学家”称号之后,阿里的图像识别技术再一次登上国际顶尖舞台。


8e92a20c43a08eca693f40098a61c0415eaaa723

图. ICDAR Robust Reading Challenge 1 end-to-end官方成绩

 

借助这一领先的OCR技术,阿里妈妈图像团队能够以95%的超高准确率识别图中违规文字信息,有效过滤商家恶意推广,维护消费者权益。2015年,阿里妈妈累计屏蔽了4600万条恶意推广。

 

OCR是计算机视觉领域的经典问题,长久以来,一直受到学术界和工业界的持续关注。在工业界,Google、Microsoft、Amazon等大型互联网公司,以及商汤科技、旷视科技(拥有Face++、Image++)等计算机视觉技术创业公司,都在OCR技术上耕耘多年。随着技术不断成熟,OCR也开始在互联网及其他行业逐步上线使用。

 

据阿里妈妈定向算法技术负责人盖坤介绍,在阿里巴巴平台上营销创意、商品等均是以图片形式展示,图像技术是理解这些信息的重要手段。同时,也有不良商家在图片中内嵌一些违规的信息达到其恶意推广的目的,图片内文字违规是比例相当大的一类,而传统监控手段多以人工肉眼来审核,费时费力,尤其是随着图片数量越来越大,这几乎已成为不可完成的任务。针对这一强烈需求,从2014年开始,阿里妈妈图像团队开始重点攻坚OCR技术,通过机器视觉的方式从图片中识别出文字,从而鉴别出违规的文案信息。

 

对恶意推广的定义,盖坤表示,一方面依据国家相关法律法规,对于违禁品、色情信息、封建迷信、假冒伪劣、减肥丰胸、夸大虚假等违规类型进行不同程度的处罚和管理,另一方面在法规之外平台有着更高要求,对损害消费者利益或进行不正当竞争的推广类型积极尝试进行管控。其中,与消费者关系最为密切的假冒伪劣单项违规类型,被阿里妈妈作为重点审查对象。

 

相对其他限定场景OCR应用相比,阿里妈妈要处理的创意图片和商品图片上的文字字体、色彩更加多样,文字布局更加灵活,背景包括各种商品、布景或自然场景,蕴含各种复杂纹理,给识别问题带来了更大的挑战。盖坤介绍,在技术路线上,相比于传统方法,抛弃了图像预处理、字符分割等流程,采用了多个深度神经网络和语言模型相结合的方法来组成完整的OCR系统。针对复杂的场景信息,将LSTM(长短时记忆)技术成功应用到建模中去,大大提高识别的准确率。

 

据悉,现在基于OCR文字识别实时审核已覆盖整个阿里妈妈业务,每天处理图片近千万张,自动反馈疑似违规图片准确率达95%以上;同时将图文审核风险发现时间从“天”降低到“秒”级。数据显示,2015年阿里妈妈累计屏蔽了4600万条恶意推广,有效净化了互联网营销环境。

 

除OCR过滤恶意推广以外,计算机视觉技术在阿里巴巴集团内部已经获得广泛使用,比如手淘的“拍立淘”产品,通过手机拍照即可搜索相似商品,2015年双11当天,千万消费者使用了“拍立淘”功能,创造了超过数千万元的销售额。另外,在商品图片版权保护、鉴黄等场景也都引入了计算机视觉技术。



关注了解更多技术干货:

c11cc5170044874d79421286cd310b6aa34b4292

 

相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
目录
相关文章
|
6月前
|
JSON 人工智能 Java
Java视觉智能识别
JavaVision是一个基于Java开发的全能视觉智能识别项目,不仅实现PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能,还可以轻松扩展到其他领域,如语音识别、动物识别、安防检查等。这使得JavaVision成为一个全面解决多种场景需求的自适应平台。
267 0
|
10月前
|
机器学习/深度学习 数据采集 TensorFlow
深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析
深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析
425 0
|
机器学习/深度学习 编解码 自然语言处理
可以提高你的图像识别模型准确率的7个技巧
可以提高你的图像识别模型准确率的7个技巧
288 0
可以提高你的图像识别模型准确率的7个技巧
|
机器学习/深度学习 传感器 编解码
【图像识别】基于hog特征的机器学习交通标识识别附matlab代码
【图像识别】基于hog特征的机器学习交通标识识别附matlab代码
|
编解码 Java 开发工具
阿里云视觉智能开放平台(VIAPI)人脸人体之人脸信息脱敏Java SDK使用说明
本文介绍人脸信息脱敏BlurFace Java SDK的语法及示例。
423 0
|
机器学习/深度学习 人工智能 算法
ResNet图像识别准确率暴降40个点!这个ObjectNet让世界最强视觉模型秒变水货
MIT和IBM的研究团队近日发布一个不同寻常的目标识别数据集ObjectNet,包含50000张特意拍摄的照片,尽可能接近真实世界。该数据集让AlexNet、ResNet、Inception等最先进的图像识别模型纷纷栽倒,性能暴降40%~45%。
361 0
ResNet图像识别准确率暴降40个点!这个ObjectNet让世界最强视觉模型秒变水货
|
机器学习/深度学习 计算机视觉
【图像识别】白天鹅黑天鹅灰天鹅?卷积神经网络帮你识别
本文将通过一系列的天鹅图片来解释卷积神经网络(CNN)的概念,并使用CNN在常规多层感知器神经网络上处理图像。
1715 0
|
16小时前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
【5月更文挑战第8天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉进步的核心技术之一。本文聚焦于深度学习在图像识别领域的应用及其所面临的挑战。首先,简述了深度学习的基本概念和关键技术,随后深入探讨了卷积神经网络(CNN)在图像分类、目标检测和语义分割中的具体应用案例。接着,分析了当前深度学习技术在处理大规模图像数据时遇到的计算资源需求高、模型泛化能力不足、对抗性攻击等问题。最后,展望了通过模型压缩、迁移学习以及增强学习等策略来应对这些挑战的未来研究方向。
|
18小时前
|
机器学习/深度学习 算法 自动驾驶
深度学习在图像识别中的创新应用
【5月更文挑战第8天】 随着科技的不断发展,深度学习技术在图像识别领域的应用越来越广泛。本文将介绍深度学习在图像识别中的创新应用,包括卷积神经网络(CNN)的原理、优化算法以及实际应用场景。通过对这些技术的深入探讨,我们可以更好地理解深度学习在图像识别领域的重要性和潜力。
4 0

热门文章

最新文章