图像算法公司-图像算法公司文档介绍内容-移动阿里云

CreateAIInstance

AlgorithmName String 是人脸图片算法 算法名称 InstanceType String 是 Offline 实例类型：Offline，Normal ContainerType String 否 Offline 部署依赖的容器类型：GCS、ECS。默认为GCS DataSourceTimes Array 否需计算的数据源的时间...

换脸鉴别

功能描述换脸鉴别基于图像算法AI技术，实现对图片人脸的真伪进行灵敏检测和深度分析。能力范围支持：1.鉴别图片中的人脸是否为AI换脸算法所深度合成的假脸。2.鉴别图片中的人脸是否为AI人脸属性编辑生成类算法所深度合成的假脸。深度伪造...

Designer组件概览

优选算法组件优选算法组件主要包含常用的通用算法（如数据读取算法、SQL脚本、Python脚本等）和大模型数据处理算法（如LLM数据处理、LVM数据处理等）、大模型训练和推理算法。推荐使用基于DLC的算法组件，支持异构资源及用户自定义环境等...

图像-文本对过滤

LVM图像处理算法提供了图像清洗、图像内容清理、图像基本信息的提取、图像caption生成的功能。您可以根据实际需求组合不同的算法，从而过滤出合适的图像数据并生成相应的文本描述，方便为后续的图像生成模型训练提供优质的图像数据。本文为...

API概览

图像处理算法API API 描述 SegmentImage 通用分割，输入一张图片，对图中主体进行分割输出对应的png透明图。在线调试 SegmentBody 人像分割，识别输入图像中的人体轮廓，与背景进行分离，返回分割后的前景人像图（4通道）。适用于单人/多人...

API概览

API目录 API 标题 API概述 CutQuestions 试卷切题切题及题目结构化接口，客户输入试卷或整页题目图片，算法返回每个题目的位置信息以及结构化（题干、选项、答案等）信息。AnswerSSE 解题辅导流式答题解析接口，客户输入需要解答题题目...

智能审核费用

直播图片审核可单击查看具体价格扫描量（张/日，不包括每日免费的3,000张）鉴黄/涉政暴恐/不良场景/图片logo 算法确定部分（元/千张）鉴黄/涉政暴恐/不良场景/图片logo 算法待用户确认部分（元/千张）广告识别算法确定部分（元/千张）...

LLM

通义千问Qwen全托管灵骏最佳实践 Mixtral-8x7B稀疏大模型最佳实践 Llama-3开源模型全托管灵骏最佳实践 Meta Llama3.1模型在PAI-Megatron-Patch的最佳实践数据处理 Designer集成了多种先进的文本、视频和图像数据处理算法，旨在提升模型...

LVM-图像合规过滤（DLC）

算法说明通过计算图像的不合规NSFW（Not Safe For Work）得分，从而过滤NSFW得分过高的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像...

图生文指令使用说明

例如，输入@BLIP Briefly describe the picture.，或@BLIP 请简单描述图片，算法将生成简洁的情景描述。文本控制指令基于上述指令完成图元分割、情景描述和细节描述后，需要整合成最终的描述文案。iTAG支持您设定最终的文案的特征。指令的...

概述

物联网边缘计算，为了提升用户算法开发和运维的效率，通过V（Version）系列边缘一体机提供算法应用和服务，支持在本地完成视频图像类的分析和推理计算，只上传所需的数据到云端，减少上行的带宽和流量成本。名词解释名词说明算法应用物...

LVM-图像文本描述生成（DLC）

图像文本描述生成算法是一种结合计算机视觉和自然语言处理的模型，旨在为输入图像生成自然语言描述。它在辅助视障人士、社交媒体内容创作、图像搜索、电商展示和新闻发布等领域有着广泛应用，显著提升了信息的可访问性和用户体验。支持的 ...

LVM-图像文本相似度过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的描述和训练数据中的描述文本（训练数据示例文件中_dj_video 字段后面的内容）的相似度（基于 clip-vit-base-patch32 计算），从而过滤相似度过低的图像来保证图像的质量，常用于后续图像生成...

LVM-图像文本匹配度过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的描述和训练数据中的描述文本（训练数据示例文件中_dj_video 字段后面的内容）的匹配度（基于 blip-itm-base-coco 计算），从而过滤匹配度过低的图像来保证图像的质量，常用于后续图像生成模型...

LVM-图像水印过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像带水印的概率，从而过滤带水印的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像数据OSS路径...

LVM-图像美学过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的美学得分，从而过滤美学得分过低的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像数据OSS...

LVM-图像人脸占比过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的人脸占比，从而过滤人脸占比过大或过小的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像...

LVM-图像大小过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的大小，从而过滤过大或过小的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像数据OSS路径，...

LVM-图像长宽比过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的长宽比，从而过滤长宽比过大或过小的图像数据来保证数据的一致性，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像...

LVM-图像分辨率过滤（DLC）

支持的计算资源 DLC 算法说明通过计算图像的分辨率，从而过滤分辨率过大或过小的图像数据来保证图像的质量，常用于后续图像生成模型的训练。输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此算法参数图像数据...

图像分类训练（torch）

如果您的业务场景涉及图像分类，则可以通过图像分类训练（torch）组件构建图像分类模型，从而进行模型推理。本文为您介绍图像分类训练（torch）组件的配置方法及使用示例。前提条件已开通OSS并完成授权，详情请参见开通OSS服务和云产品...

可视化分析

统计分析：百分位、洛伦兹曲线深度学习：TensorFlow(CPU)视觉算法：图像分类训练(torch)、图像检测训练(easycv)、图像分割训练(easycv)使用方式通过可视化大屏查看分析报告通过TensorBoard查看模型训练结果通过可视化大屏查看分析报告 ...

图片智能处理参数

图片智能是由智能媒体管理（IMM）提供的利用AI算法对图片内容进行分析的能力，例如对图片进行人脸检测、标签检测、质量评分等。您可以将要分析的图片上传保存到阿里云对象存储OSS上，通过OSS的RESTful数据处理接口 x-oss-process 和 x-oss-...

图像人体擦除

本文介绍图像生产（imageenhan）类目下的图像人体擦除ErasePerson的语法及示例。功能描述图像人体擦除能力可以擦除图像中指定区域的人像，并自动填充背景。说明您可以进入在线咨询获取在线人工帮助。阿里云视觉智能开放平台视觉AI能力...

图像度量学习训练（raw）

算法简介图像度量学习训练（raw）组件提供了resnet50、resnet18、resnet34、resnet101、swint_tiny、swint_small、swint_base、vit_tiny、vit_small、vit_base、xcit_tiny、xcit_small和xcit_base等主流模型。可视化配置组件输入桩输入...

RecognizeEduFormula-印刷体数学公式识别

本接口图片示例本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98...

RecognizeWaybill-电子面单识别

本接口图片示例本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。全字段识别智能识别快递运单上所包含的全部字段。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等...

RecognizeEduOralCalculation-口算判题

本接口图片示例本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97...

RecognizeTaxiInvoice-出租车发票识别

本接口图片示例本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97...

RecognizeBasic-电商图片文字识别

针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别。接口说明本接口适用场景阿里云电商图片文字识别，是阿里云官方自研 OCR 文字识别产品，支持电商商品宣传图片、社区贴吧图片、网络 UGC 图片识别，...

虚拟数字人

虚拟数字人开放平台，是由阿里云所提供的数字人 PaaS&SaaS 解决方案，它集成了自然语言处理、图形图像、语音等算法能力，提供给客户标准的 PaaS 接口与 SaaS 运营工具，方便客户将数字人能力集成进不同的终端与场景。主要面对的行业包括新...

图像生成推理

图像生成推理算法主要利用训练好的模型来生成符合特定特征或条件的高质量图像。它支持加载各种经过训练的GAN模型（如DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN），并基于随机噪声生成新图像。该算法广泛应用于图像生成、图像增强和...

图像生产介绍

图像隐形图片水印图像盲水印算法，加/解析水印，添加内容包括图像logo和文字两种。图像标志擦除擦除图片中的常见标志，如台标、互联网平台logo等。图像字幕擦除擦除图片中的标准字幕。图像人体擦除可以擦除图像中指定区域的人像，并...

CreateDocumentCollection-创建文档库

768 维 m3e-small（不推荐）:512 维 clip-vit-b-32（不推荐）：CLIP ViT-B/32 模型,512 维,图片向量化算法 clip-vit-b-16（不推荐）：CLIP ViT-B/16 模型,512 维,图片向量化算法 clip-vit-l-14（不推荐）：CLIP ViT-L/14 模型,768 维,图片...

图像生成训练

配置此算法参数训练图片所在OSS目录，选择图像数据所在的OSS目录。输出桩训练生成的模型，保存地址对应算法参数模型输出路径。关于参数详细说明，请参见下文中的参数说明。配置组件在Designer工作流页面添加图像生成训练组件，并在...

系统管理

视频配置视频配置是对接入算法任务的视频、算法告警的结果字段、图片等相关参数进行配置。在系统管理页面，单击视频配置页签。根据系统提示，设置视频参数，然后单击确定。参数描述图片储存时间（分）算法告警图片在边缘一体机本地...

工业大脑

工业大脑是基于阿里云大数据的一体化计算平台，通过数据工厂对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行汇集，借助语音交互、图像/视频识别、机器学习和人工智能算法，激活海量数据价值，为解决工业...

城市视觉智能引擎

城市视觉智能引擎依托于阿里云分布式计算和存储平台，利用先进的视频图像、图形学处理技术和深度学习算法，建立城市级人工智能模型，实现对整个城市视觉数据(枪机、球机等摄像头数据以及遥感、卫星、无人机采集的图像数据)的接入、计算、...

图像分析处理常见错误码

400 InvalidImage.Type 图片类型错误，请检查图片类型，参考算法API文档，使用算法支持的图片类型。400 InvalidImage.URL 图片链接非法，请检查图片链接是否可访问，非上海OSS图片链接，请参见文件URL处理。对于上海OSS链接请使用标准的...

商品理解常见错误码

400 InvalidImage.Type 图片类型错误，请检查图片类型，参考算法API文档，使用算法支持的图片类型。400 InvalidImage.URL 图片链接非法，请检查图片链接是否可访问，非上海OSS图片链接，请参见文件URL处理。对于上海OSS链接请使用标准的...