接口说明 本接口适用场景 阿里云 VIN 码识别,是阿里云官方自研 OCR 文字识别产品,适用于识别车辆上的 VIN 码,用于进行车辆质检检查、车辆登记的等场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,...
AI平台OCR图片文字识别/文本向量服务 OCR图片文字识别:针对架构图、分析图表等图片数据,AI搜索开放平台提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于OCR能力对图片文字进行识别,将文字信息...
接口说明 本接口适用场景 阿里云车牌识别,是阿里云官方自研 OCR 文字识别产品,可有效识别车辆车牌信息,支持多车牌以及多类车型检测识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、...
文档智能是文字识别技术的进一步升级,除了文字识别,文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术,实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能...
content":"阿里云文字识别OCR 阿里云文字识别OCR/目录 文档版本:20230509 3 目录 法律声明.2 目录 3 前言 4 概述.4","name":"OCR基础能力产品白皮书V1.91,可对外.pdf","title":""},{"_id":"3459649677041723584_73","_q_score":0....
2021-08-31 华东2(上海)IPC视频目标检测 2021年07月 类目名称 接口名称 功能描述 发布时间 发布地域 相关文档 文字识别 增值税发票卷票识别 支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率...
接口说明 本接口适用场景 阿里云不动产权证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别不动产权证和房产证上的关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、...
文字识别服务支持基于URL发送HTTP/HTTPS请求。请求参数需要包含在URL中,请求及返回结果都使用 UTF-8 字符集编码。以下为一条未编码的URL请求示例:https://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizeBankCard& 公共请求参数 ...
接口说明 本接口适用场景 阿里云身份证文字识别,是阿里云官方自研 OCR 文字识别产品,用于对中国大陆身份证(含临时身份证)正反面图片进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...
接口说明 本接口适用场景 阿里云银行卡识别,是阿里云官方自研 OCR 文字识别产品,适用于获取银行卡上的卡号、日期、银行名称等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务...
AI平台OCR图片文字识别/文本向量服务 OCR图片文字识别:针对架构图、分析图表等图片数据,AI搜索开放平台提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于OCR能力对图片文字进行识别,将文字信息...
问题描述 在使用OCR识别营业执照时,可能会识别错误的名称、或者出现错别字、经营期限无法读取等异常情况。问题原因 目前OCR无法保证100%识别正确。解决方案 如果出现异常情况,请提供识别错误的内容,然后 提交工单 ...适用于 印刷文字识别
本文介绍文字识别(ocr)类目下的VIN码识别RecognizeVINCode的语法及示例。功能描述 VIN码识别能力可以识别车辆VIN码,输出车辆VIN码数值。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验...
接口说明 本接口适用场景 阿里云核酸检测报告识别,是阿里云官方自研 OCR 文字识别产品,适用于识别核酸检测报告上的姓名、证件号码、采样时间、检测结果等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,...
文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见 在用户页面为 RAM 用户授权。重要提示 类型 概述 图片格式 本接口支持:PNG、JPG、JPEG、PDF、BMP、GIF、TIFF、WebP。图片尺寸 图片长宽需要大于 15 像素...
示例值 描述 Code Integer 200 状态码,正常请求返回200 Message String ok 错误的时候返回错误信息 RequestId String DC2DCCC9-C3DF-4F59-8D8E-78185729F16D 请求唯一串 Data Object 返回的结果 Language String zh 图片中的文字识别后的...
当前正在调用的服务尚未开通,请登录文字识别控制台,单击服务管理与开通,检查并开通相应服务。诊断 400 unmatchedImageType The image type does not match the API operation.图像类型与API接口不匹配 诊断 400 ...
视频文字识别标签OCR 识别视频图像中的文字,提取图像文本内容。视频语音识别标签ASR 分析视频中的语音信息,提取语音文本内容。视频标签 分析视频中节目、人物角色、物体、场景、地域等内容。图片标签 分析图片中的人物角色、地域、动作...
本文介绍文字识别(ocr)类目下的银行卡识别RecognizeBankCard的语法及示例。功能描述 银行卡识别能力可以检测输入的主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。说明 您可以进入 在线咨询 获取在线人工帮助。当前...
接口说明 本接口适用场景 阿里云支付详情页识别,是阿里云官方自研 OCR 文字识别产品,适用于识别支付详情页所包含的收款方名称、合计金额、付款方式、商品说明、支付时间等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云银行开户许可证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别银行开户许可证所包含的账号、核准号、企业名称、法人姓名以及开户行等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云国际身份证识别,是阿里云官方自研 OCR 文字识别产品,适用于出入境审查、国内外身份核验等各种需要提取身份证信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,...
ok RequestId string 请求唯一串 DC2DCCC9-C3DF-4F59-8D8E-78185729F16D Data object 返回的结果 Language string 图片中的文字识别后的语种 zh 示例 正常返回示例 JSON 格式 {"Code":200,"Message":"ok","RequestId":"DC2DCCC9-C3DF-4F59-...
接口说明 本接口适用场景 阿里云社保卡识别,是阿里云官方自研 OCR 文字识别产品,适用于识别社会保障卡中所包含的标题、姓名、社保卡号码、卡号、发卡日期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,...
接口说明 本接口适用场景 阿里云户口本识别,是阿里云官方自研 OCR 文字识别产品,可用于识别户口本户主页的户主姓名、住址、户号等字段。也适用于识别户口本常住人口页的出生日期、出生地、姓名、民族等信息的场景。阿里云 OCR 产品基于...
对媒体的内容、文字、语音、场景进行多模态分析,实现智能审核、内容理解、智能编辑等多种处理功能。音视频转码 把音视频码流转换为另一种清晰度、编码格式或封装格式,以适应不同网络带宽、不同终端播放设备的使用场景。媒体处理覆盖了...
本文介绍文字识别(ocr)类目下的火车票识别RecognizeTrainTicket的语法及示例。功能描述 火车票识别能力可以对火车票进行结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段...
本文介绍文字识别(ocr)类目下的PDF识别RecognizePdf的语法及示例。功能描述 PDF识别能力可以对PDF上的文字进行结构化识别。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击 ...
2020-10-30 华东2(上海)图像人体擦除 文字识别 证件翻拍识别 可以识别中华人民共和国居民身份证照片是否为屏幕翻拍图。2020-10-30 华东2(上海)证件翻拍识别 门头照识别 可以识别门头招牌的图像,并且过滤出门头信息,例如门头照、Logo...
方法描述 文字识别 参数说明 image_path str 图片的路径 engine str 引擎 可选项:google:谷歌 aliyun:阿里云 paddle:飞桨 app_code str OCR文字识别appcode detail str 是否需要识别文字的详细信息 eliminate_spaces bool 是否去掉文字...
高精度模型效果 内置超大规模多模态预训练模型、多场景高精度文字识别模型,和统一的信息抽取模型,满足不同场景零代码建模的精度需求。高效模型生产效率 内置智能化预标注和方便易用的一站式标注套件极大提升标注效率,内置基础预训练模型...
接口说明 本接口适用场景 阿里云精细版结构化切题,是阿里云官方自研 OCR 文字识别产品,适用于整页练习册、试卷或教辅种的题目场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作...
阿里云视觉智能开发平台目前支持人脸人体、文字识别、商品理解等10+类别的视觉AI技术,其中包括的上百种能力均可通过SDK方式调用。说明 阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)...
本文介绍文字识别(ocr)类目下的车牌识别RecognizeLicensePlate的语法及示例。功能描述 车牌识别能力可以准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。说明 您可以...
接口说明 本接口适用场景 阿里云税收完税证明识别,是阿里云官方自研 OCR 文字识别产品,适用于识别非税收入证明所包含的税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键信息的场景。阿里云 OCR 产品基于阿里巴巴...
SDK简介 文字识别OCR SDK 封装了2021-07-07版本下的所有API,以访问密钥(AccessKey)识别调用者身份,无需手动构造签名,提供自动签名等功能,能够显著简化开发过程,降低错误率,提高开发效率和代码的可维护性。阿里云开发者中心汇聚了...
本文介绍文字识别(ocr)类目下的驾驶证识别RecognizeDriverLicense的语法及示例。功能描述 驾驶证识别能力可以识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期...
文字提取 语音识别 2025-11-20 qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17(快照版)通义千问录音文件识别发布了新模型,专为音频文件的异步转写设计,支持最长12小时录音。录音文件识别-通义千问 界面交互 2025-11...
本文介绍文字识别(ocr)类目下的二维码识别RecognizeQrCode的语法及示例。功能描述 二维码识别能力可以识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的URL或文本),可支持图像中含有多个二维码识别。...
接口说明 本接口适用场景 阿里云行驶证识别,是阿里云官方自研 OCR 文字识别产品,精准定位和识别行驶证正、副页所包含的关键信息,支持正副页在同一张图片的场景进行自动分割与结构化识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...