视觉训练卡-视觉训练卡文档介绍内容-移动阿里云

使用Arena提交PyTorch分布式训练作业

PyTorch是一个开源的深度学习框架，广泛应用于各种深度学习模型的训练任务中，本文演示如何使用Arena提交PyTorch多机多卡训练作业，并通过TensorBoard可视化查看训练作业。前提条件已创建包含GPU的Kubernetes集群。具体操作，请参见创建...

云原生AI套件管理员运维指南

通过表格的形式展示各个训练任务的情况，包括：训练任务所在命名空间（Namespace）、训练任务名称（Job Name）、训练任务类型（Job Type）、训练任务状态（Job Status）、训练任务持续时间（Duration）、训练任务请求GPU卡数（Request GPUs...

面向NL2BI的大模型微调最佳实践

本文以Qwen系列大模型为例，介绍如何在人工智能平台PAI上构建从训练数据生成、模型微调训练到服务部署和调用的NL2BI全链路解决方案。背景信息 NL2SQL（自然语言生成SQL）技术旨在将自然语言转换为数据库查询语句，使得即使不熟悉SQL的用户...

银行卡识别

取值如下：CC：贷记卡 SCC：准贷记卡 DCC：存贷合一卡 DC：储蓄卡 PC：预付卡 SDK参考阿里云视觉AI文字识别类目下的银行卡识别能力推荐使用SDK调用，支持多种编程语言，调用时请选择AI类目为文字识别（ocr）的SDK包，文件参数通过SDK调用...

可视化分析

统计分析：百分位、洛伦兹曲线深度学习：TensorFlow(CPU)视觉算法：图像分类训练(torch)、图像检测训练(easycv)、图像分割训练(easycv)使用方式通过可视化大屏查看分析报告通过TensorBoard查看模型训练结果通过可视化大屏查看分析报告 ...

图像关键点训练

图像关键点训练组件位于组件库视觉算法文件夹下的离线训练模型子文件夹。可视化配置组件输入桩输入桩（从左到右）限制数据类型建议上游组件是否必选训练数据 OSS 读OSS数据否训练数据标注文件 OSS 读OSS数据否验证数据 OSS 读...

模型导出

40000 Worker GPU卡数否在EasyRec训练中，一般不需要使用GPU。输出桩输出桩（从左到右）数据类型下游组件模型导出路径 OSS路径模型部署 PAI命令及说明 PAI-project algo_public-name easy_rec_ext-Dcmd="export"-Dconfig="oss:/rec_...

模型训练

40000 Worker GPU卡数否在EasyRec训练中，一般不需要使用GPU。0 PAI命令及说明 PAI-project algo_public-name easy_rec_ext-Darn="acs:ram:xxxx:role/aliyunodpspaidefaultrole"-Dbuckets="oss:/rec_sln_demo/"-Dcluster="{\"ps\":{\...

小程序场景下直接调用

视觉智能开放平台的API接口推荐使用SDK进行调用，推荐在服务端进行接入，在客户端直接接入AccessKey ID和AccessKey Secret有泄露风险，可以使用STS授权用户调用服务。背景信息使用小程序调用之前，需要使用STS服务获取临时访问凭证。阿里...

OCR文档自学习概述

本平台采用少样本训练、智能预标注，视觉-语义联合学习等前沿AI技术，支持客户低成本实现个性化场景的文档数字化和信息化业务。提供用户可控的定制化工具，帮助用户实现其业务场景下的模型定制，实现业务数据驱动AI服务。多模态信息抽取，...

视频分类训练

视频分类训练算法组件位于组件库视觉算法文件夹下的离线训练模型子文件夹。可视化配置组件输入桩输入桩（从左到右）限制数据类型建议上游组件是否必选训练数据 OSS 读OSS数据否。如果没有通过该输入桩传入训练数据，则需要在 ...

模型上架与更新

代码能力（Qwen-Coder）多模态向量 2025-09-23 tongyi-embedding-vision-plus、tongyi-embedding-vision-flash 以Qwen系列大语言模型为基座构建，围绕视觉向量化能力进行增强训练，支持文字、图像、视频三种模态。文本与多模态向量化语音...

使用流程

本文为您介绍分布式训练（DLC）完整的使用流程。在模型训练阶段，您可通过DLC发起大规模的分布式训练任务。具体使用流程如下：提交训练任务前，需要完成以下准备工作：准备资源支持使用灵骏智算资源（用于大模型的训练任务）和通用计算...

PAI-TensorFlow使用指南

PAI-TF是人工智能平台PAI推出的，优化原生Tensorflow的内核并开发周边工具，旨在提升深度学习训练效率的一款产品。PAI-TF拥有服务化、分布式调度、全局计算调度、GPU卡映射及模型在线预测等特点。重要公共云GPU服务器即将过保下线，您可以...

使用抢占式实例节省大模型微调成本

为降低模型微调训练成本，您可以使用伸缩组自动调度抢占式实例，同时配置抢占式实例中断回收时自动创建新实例、基于最新Checkpoint恢复训练，保障任务连续性。方案概览本方案基于伸缩组实现大模型低成本微调训练，采用抢占式实例优先...

Meta Llama3.1模型在PAI-Megatron-Patch的最佳实践

模型参数量全参数训练资源推理资源（最低）Megatron训练模型切片 8B 8卡*gu7xf、8卡*gu7ef 1*V100（32 GB显存）、1*A10（22 GB显存）TP1、PP1 70B 4*8卡*gu7xf、4*8卡*gu7ef 6*V100（32 GB显存）、2卡*gu7xf TP8、PP2 已创建阿里云文件...

视觉计算服务（文档停止维护）

视觉计算服务Visual Compute Service（简称VCS）是一款弹性可伸缩的视觉智能计算服务...提供视觉数据接入、AI算法快速集成、AI算法训练、计算资源调度的能力，通过API支撑开发业务应用，同时帮助开发者提升视觉AI创新效率，专注核心业务创新。

安装和使用Deepytorch Training

例如，选择单机2卡机型时，使用Deepytorch加速训练模型时，代码如下：bash run_benchmark_deepgpu.sh 1 0 2 如果训练日志出现OOM报错，请您自行修改 run_benchmark.sh 和 run_benchmark_deepgpu.sh 脚本中的-batch-size 为256或128。...

基于DeepGPU加速器快速实现Qwen1.5-7B指令微调

本文使用 ecs.ebmgn7ex.32xlarge 规格的ECS实例（您也可以选择包含8卡NVIDIA GPU的实例）进行训练，仅部分地域可用区支持该实例规格，具体请参见 ECS实例规格可购买地域。关于如何创建VPC和交换机，请参见创建专有网络和创建交换机。...

关于视觉智能开放平台部分公测能力停止服务的公告

由于产品业务调整，阿里云视觉智能开放平台部分公测能力将于 2024年09月30日起停止提供服务，后续不再支持新老用户开通接入及调用服务。本次下线的公测能力详情如下：类目能力人脸人体人脸滤镜（FaceFilter）、身体美型（RetouchBody）...

GPU

单Pod多GPU卡共享：常用于分布式训练开发。Binpack分配策略：多个Pod会优先共享使用同一GPU卡，适用于需要提升GPU卡利用率的场景。Spread分配策略：多个Pod会尽量分散使用不同GPU卡，适用于GPU高可用场景。支持 GPU拓扑感知调度功能：通过...

图像视频分析（PAI-EasyVision）

PAI-EasyVision（视觉智能增强算法包）提供多种模型的训练及预测功能，旨在帮助计算机视觉应用开发者方便快捷地构建视觉模型并应用于生产。随着深度学习技术的快速发展，计算视觉技术已经跨入大规模商业化应用阶段。对于视觉AI应用开发者而...

一键微调DeepSeek-R1蒸馏模型

Qwen-32B Qwen2.5-32B 2卡GU8IS（48 GB显存）DeepSeek-R1-Distill-Llama-70B Llama-3.3-70B-Instruct 8卡GU100（80 GB显存）训练模型进入Model Gallery页面。登录 PAI控制台。在顶部左上角根据实际情况选择地域。在左侧导航栏选择工作...

图像分类训练（torch）

图像分类训练（torch）组件位于组件库视觉算法文件夹下的离线训练模型子文件夹。可视化配置组件输入桩输入桩（从左到右）限制数据类型建议上游组件是否必选训练数据标注文件 OSS 读OSS数据否验证数据标注文件 OSS 读OSS数据否 ...

训练监控与报警

分布式训练（DLC）任务支持查看和监控资源状况，提供详细的监控指标，帮助您掌握资源负载情况。通过监控报警功能，您可以实时监控DLC任务的资源水位，并配置报警规则和通知。如果资源水位出现波动，例如GPU使用率超过设定阈值，会发送报警...

快速开始：Llama2系列模型部署及微调

如果您希望以零代码的方式在PAI上完成Llama2系列大语言模型的训练和推理，您可以使用快速开始的一键部署，快速启动Llama2系列模型的在线推理服务，并通过WebUI和API两种方式调用，或者使用自己的数据集对预训练模型进行微调训练，实现定制...

使用Arena提交eRDMA加速的PyTorch分布式训练作业

在多节点 GPU 训练中网络通信延迟拖累整体性能时，为缩短模型训练周期，可利用 Arena 提交 PyTorch 分布式作业并配置 eRDMA 网络加速，实现低延迟、高吞吐的节点间通信，提升训练效率和集群利用率。适用范围集群类型：仅支持 ACK托管集群...

视觉智能开放平台

阿里云视觉智能开放平台（https://vision.aliyun.com）是基于阿里巴巴视觉智能技术实践经验，面向视觉智能技术企业和开发商（含开发者），为其提供高易用、普惠的视觉API服务，帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力...

文件URL处理

使用阿里云视觉智能开放平台服务时，需要传入文件URL，视觉智能平台根据传入的文件URL对文件进行智能处理。本文介绍如何处理本地文件或网络文件链接。背景信息阿里云视觉智能开放平台服务的接口响应时间依赖文件的下载时间，为了保证被...

城市视觉智能引擎

城市视觉智能引擎依托于阿里云分布式计算和存储平台，利用先进的视频图像、图形学处理技术和深度学习算法，建立城市级人工智能模型，实现对整个城市视觉数据(枪机、球机等摄像头数据以及遥感、卫星、无人机采集的图像数据)的接入、计算、...

智能视觉生产（文档停止维护）

以视觉AI能力为基础，结合平台能力及业务数据积累，面向传媒娱乐、工业制造、数字营销等行业提供视频、模型、图像等视觉内容的智能化生产服务，帮助客户提升生产效率，压缩生产周期，打通生态闭环。

SanityCheck：算力健康检测

使用限制目前，该功能仅支持使用灵骏智算资源创建的PyTorch类型的训练任务，且要求任务资源的GPU（卡数）大于0。开启健康检测通过控制台在 PAI控制台中创建DLC训练任务时，通过配置以下关键参数，开启健康检测功能。任务成功创建后，...

ACS支持的GPU规格族

8卡之间支持NVLINK互联，适用于中小模型训练场景。节点间支持1.6T带宽的高速RDMA互联。支持该GPU卡的Pod规格约束如下：GPU vCPU Memory（GiB）Memory支持步长（GiB）存储（GiB）1（96G显存）2 2~16 1 30~256 4 4~32 1 6 6~48 1 8 8~64 1 10...

Web前端直接调用

视觉智能开放平台的API接口推荐使用SDK进行调用，推荐在服务端进行接入，在客户端直接接入AccessKey ID和AccessKey Secret有泄漏风险，可以使用STS授权用户调用服务。背景信息在进行Web调用之前，需要使用STS服务获取临时访问凭证。阿里云...

文字识别介绍

银行卡识别输入主流银行卡图像，输出3个信息，包括：发卡行、银行卡号、有效日期。二维码识别识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。资产类证件...

PAI图像语义分割训练

PAI-EasyVision提供图像语义分割模型的训练及预测功能，本文为您介绍如何通过PAI命令进行图像语义分割模型训练。图像语义分割训练图像分割组件实现了基于DeepLab-V3的语义分割模型，详情请参见 Encoder-Decoder with Atrous Separable ...

快速开始：Qwen2.5-Coder模型的训练、评测、压缩与...

资源配置要求：模型规模资源要求 Qwen2.5-Coder-0.5B/1.5B 训练阶段：使用16GB显存（例如T4、P100、V100）及以上卡型。部署阶段：最低卡型配置为单卡P4，推荐部署机型为单卡GU30、单卡A10、单卡V100、单卡T4等。Qwen2.5-Coder-3B/7B 训练...

PAI-ChatLearn：Qwen3强化学习最佳实践

本文以Qwen3模型为例，基于 PAI-ChatLearn 训练框架，介绍如何在PAI中使用灵骏智算资源进行LLM高效分布式强化学习训练并部署训练后模型。一、准备工作 1.1 开发环境准备在开始执行操作前，请确认您已经完成以下工作：开通PAI并创建默认...

OCR文档自学习计费

商品信息机器资源后付费任务类型机型配置-卡型刊例价（元/时）单据票证信息抽取模型训练 ecs.gn6e-c12g1.3xlarge 1*NVIDIA V100 19.739 若标注无误则点击表格信息抽取模型训练 ecs.gn6e-c12g1.3xlarge 1*NVIDIA V100 19.739 长文档...

OCR文档自学习计费

商品信息机器资源后付费任务类型机型配置-卡型刊例价（元/时）单据票证信息抽取模型训练 ecs.gn6e-c12g1.3xlarge 1*NVIDIA V100 19.739 表格信息抽取模型训练 ecs.gn6e-c12g1.3xlarge 1*NVIDIA V100 19.739 长文档信息抽取模型...