接口说明 本接口适用场景 阿里云银行开户许可证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别银行开户许可证所包含的账号、核准号、企业名称、法人姓名以及开户行等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云核酸检测报告识别,是阿里云官方自研 OCR 文字识别产品,适用于识别核酸检测报告上的姓名、证件号码、采样时间、检测结果等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,...
本接口图片示例 本接口核心能力 分类 概述 多国身份证 对越南、韩国、印度、孟加拉居民身份证提供识别服务 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变...
针对全英文图片文档场景下英文印刷体字符高效检测和识别,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能。接口说明 本接口适用场景 阿里云英语专项识别,是阿里云官方自研 OCR 文字识别产品,适用于全英文图片...
接口说明 本接口适用场景 阿里云社保卡识别,是阿里云官方自研 OCR 文字识别产品,适用于识别社会保障卡中所包含的标题、姓名、社保卡号码、卡号、发卡日期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,...
可结构化识别户口常住人口登记卡页面及户主页的内容,有效识别户口本上的相关户籍证明信息。接口说明 本接口适用场景 阿里云户口本识别,是阿里云官方自研 OCR 文字识别产品,可用于识别户口本户主页的户主姓名、住址、户号等字段。也适用...
支持包括税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键字段的结构化识别输出。接口说明 本接口适用场景 阿里云税收完税证明识别,是阿里云官方自研 OCR 文字识别产品,适用于识别非税收入证明所包含的税务机关、...
接口说明 本接口适用场景 阿里云试卷切题识别,是阿里云官方自研 OCR 文字识别产品,适用于识别整页练习册、试卷或教辅中的题目的场景,适用于教育材料内容的数字化生产与题库录入。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...
本接口图片示例(仅支持正面识别)本接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体...
支持对行驶证正页、副页关键字段的自动定位和识别,同时也支持对正副页在同一张图片的场景进行自动分割与结构化识别。接口说明 本接口适用场景 阿里云行驶证识别,是阿里云官方自研 OCR 文字识别产品,精准定位和识别行驶证正、副页所包含...
支持包括票号、出发站、到达站、开车时间、票价、座位类型、旅客信息、座位号、车次等字段结构化识别输出。2024.12.31更新后,支持电子火车票,增加返回以下新字段:电子客票号、购买方名称、购买方统一信用代码、标题、开票日期、备注。...
path str 待识别图像路径,支持本地路径或url路径 output_char_info bool 是否输出单字识别结果 need_rotate bool 是否需要自动旋转功能 output_table bool 是否输出表格识别结果,包含单元格信息 need_sort_page bool 是否按顺序输出文字...
可快速精准的识别第二类医疗器械经营备案凭证所包含备案编号、企业名称、住所、经营场所、库房地址、经营方式、法定代表人、企业负责人、经营范围、许可期限、备案日期等关键字段信息。接口说明 本接口适用场景 阿里云第二类医疗器械经营...
可快速精准的识别食品生产许可证所包含经营者名称、社会信用代码、法定代表人姓名、地址、经营场所、经营项目、有效期、许可证编号等关键字段信息。接口说明 本接口适用场景 阿里云食品生产许可证识别,是阿里云官方自研 OCR 文字识别产品...
支持包括票据代码、交款人、票据号码、合计金额、收款单位等关键字段结构化识别输出。接口说明 本接口适用场景 阿里云非税收入发票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别非税收入发票所包含的票据号码、标题、开票日期、...
支持包括出票日期、票据号码、出票人信息、收票人信息、承兑人信息、票据金额等关键字段结构化识别输出。接口说明 本接口适用场景 阿里云银行承兑汇票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别银行承兑汇票上的出票日期、到期...
接口说明 本接口适用场景 阿里云航空行程单识别,是阿里云官方自研 OCR 文字识别产品,适用于识别航空行程单所包含的乘机人姓名、身份证号、电子客票号码、验证码、填开日期、销售单位代号、承运人、填开单位、票价、税费、燃油附加费等...
可快速精准的识别食品经营许可证所包含生产者名称、社会信用代码、法定代表人姓名、地址、生产场所、食品类别、有效期、许可证编号等关键字段信息。接口说明 本接口适用场景 阿里云食品经营许可证识别,是阿里云官方自研 OCR 文字识别产品...
工业大脑是基于阿里云大数据的一体化计算平台,通过数据工厂对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行汇集,借助语音交互、图像/视频识别、机器学习和人工智能算法,激活海量数据价值,为解决工业...
支持增值税专用发票、增值税普通发票、增值税电子发票识别,支持包括发票代码、发票号码、开票日期、发票金额、发票税额、检验码、购买方税号、销售方税号、发票详情等关键字段结构化识别输出。接口说明 本接口适用场景 阿里云增值税发票...
尊敬的阿里云用户,为进一步提升用户体验和产品性价比,提高视觉智能开放平台公有云服务水平,自 2023年12月27日 起,视觉智能开放平台 人脸人体、图像识别、分割抠图、图像生产 的部分公测能力API将转正式商业化售卖。更多详情请参见下文...
产品优势 基于达摩院 AI 能力 阿里巴巴达摩院团队人工智能(Artificial Intelligence,简称 AI)实验室在语音识别、图像识别、视觉理解、语言理解等方面开展大量研究,并沉淀出 AI 相关的大量技术成果。智能双录质检产品基于达摩院 AI 技术...
PAI灵骏 主要面向图形图像识别、自然语言处理、搜索广告推荐、通用大模型等大规模分布式的AI研发场景,适用于自动驾驶、金融风控、药物研发、科学智能、元宇宙、互联网和ISV等行业。您只需为AI训练所消耗的资源付费,无需建设、调优和运维...
IVPD提供以下功能。IVPD提供以下功能 图像处理 ...输入图:识别出的风格标签:风格类型:视觉风格:中国风,语义风格:典雅 图像元素识别 识别输入图中所包含的元素,用矩形框标注出其位置,并区分其对应的基本类型(人/物、修饰、文案)。
检测原理 智能双录质检为移动端 App 提供了智能检测 SDK。通过 SDK,为终端 App 提供离线实时检测能力,即支持在断网或联网时,对现场进行录音录像,并实现实时交互式检测。在本地双录质检过程中,智能检测 SDK 根据质检流程,调用相应的...
本产品(智能媒体生产/2020-11-09)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可...
检测原理 智能双录质检为移动端 App 提供了智能检测 SDK。通过 SDK,为终端 App 提供实时检测能力,即支持在联网条件下,对线上各方进行录音录像,并实现实时交互式检测。在远程双录质检过程中,智能检测 SDK 根据质检流程,调用相应的检测...
说明 目前操作审计支持视觉智能开放平台的功能包括:人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称 事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...
文档智能是文字识别技术的进一步升级,除了文字识别,文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术,实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能...
文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术,对非结构化和半结构化文档进行智能自动化处理,从而简化业务操作流程、提升文档处理效率,帮助企业更准确地进行大模型应用的场景建设。...
主体识别 从图像或视频中自动定位并识别主要目标或对象,支持单个及多个主体的识别,适用于智能监控、自动驾驶、图像检索等应用。文本稀疏向量 提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频...
本文为您介绍图像识别API返回的错误码信息。说明 阿里云视觉智能开放平台各类目视觉AI能力API接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。问题诊断中心 使用 问题诊断中心 可帮助...
通过阅读本文,您可以了解如何通过AICallKit SDK实时获取到用户侧讲话字幕,及智能体回答字幕。使用说明 本示例主要旨在帮助您在不含UI集成的情况下,如何利用API实现该功能。您需要提前集成AICallkit SDK。如何集成,请参见 Android集成...
阿里云视觉智能开放平台(Vision Intelligent Application Programming Interface Platform)简称视觉智能平台,是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助...
全字段识别 智能识别快递运单上所包含的全部字段。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 识别准确率可达 93%。如何使用本接口 步骤 概述 1 开通 车辆物流识别 服务。开通服务前后,您可以通过 ...
通用预付费资源包类型 适用范围 视觉AI图像通用资源包 人脸人体 人脸核身APP认证、人脸核身服务端、图像人脸融合、人脸美颜、人物动漫化、人像素描风格化、人脸修复增强、人脸活体检测、明星识别、公众人物识别、智能美肤SD、智能美肤HD、...
接口说明 本接口适用场景 阿里云身份证文字识别,是阿里云官方自研 OCR 文字识别产品,用于对中国大陆身份证(含临时身份证)正反面图片进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...
平台采用AI驱动技术,能够智能识别语音内容并生成精准字幕,支持多种语言配音,大幅提升制作效率。结构化媒资 通义听悟依托通义千问语言模型及音视频人工智能模型的强大能力,可进行实时语音识别,实现对话的实时记录、多语言翻译、发言...
识别特征基于字段的数据内容、元数据属性,结合属于、正则表达式、包含、不包含等运算条件对数据特征进行表达,从而智能推荐相关的数据分类分级或数据标准。Dataphin内置了多种识别特征表达式,如手机号、身份证号等。此外,您也可以自定义...
能力介绍 目前阿里云视觉智能开放平台上线的图像生产能力包括:类别 能力 说明 图像生成 生成式图像超分 基于生成式大模型,在放大图像分辨率的同时,显著提升图像细节丰富度,使图像变得更加清晰。图像增强 图像超分 将输入图放大四倍,...