分布式云

_相关内容

在ASM中实现分布式跟踪

服务网格 ASM集成了阿里可观测链路OpenTelemetry版,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等能力,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提升开发诊断效率。...

分布式工作流Argo集群概述

分布式工作流Argo集群(简称 工作流集群 或Serverless Argo Workflows)采用无服务器模式,使用阿里容器计算服务ACS/弹性容器实例ECI运行工作流,通过优化开源工作流引擎性能及Kubernetes集群参数,实现大规模工作流的高效弹性调度,同时...

【通知】2023年08月起PolarDB分布式版的标准版系列...

原生数据库PolarDB分布式版于2023年08月起下调标准版系列实例所有规格的包年包月和按量付费价格。下调后,标准版系列实例的价格将平均降低约40%,最低至0.75元/小时。降价开始时间 2023年08月 降价对象 PolarDB分布式版的标准版系列实例...

创建及管理分布式训练任务

PAI为您提供任务管理页面,支持通过任务管理页面统一可视化的管理基于原生AI基础平台DLC提交的分布式训练任务。本文为您介绍如何创建及管理任务。操作账号和权限要求 阿里主账号:使用该账号可完成所有操作,无需额外授权。RAM用户:...

金融分布式架构系统权限策略参考

本文描述金融分布式架构支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里访问控制(RAM)...

在ASM中实现分布式跟踪

服务网格 ASM集成了阿里可观测链路OpenTelemetry版,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等能力,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提升开发诊断效率。...

查询PolarDB-X 1.0分布式订阅任务的子任务信息

调用DescribeSubscriptionMeta查询PolarDB-X 1.0分布式订阅任务下子任务的信息。由于PolarDB-X 1.0订阅任务为分布式订阅,其下挂的一个RDS MySQL对应一个订阅子任务,您可调用本接口查询订阅子任务的信息。PolarDB-X 1.0订阅任务的实例ID、...

迁移Batch批量计算到分布式工作流Argo集群

数据存储 确保分布式工作流Argo集群可以访问工作流运行所需要的数据,工作流集群可以挂载访问阿里OSS、NAS、CPFS、盘等存储资源。更多信息,请参见 使用存储卷。测试验证 验证工作流运行正常、数据访问、结果输出正常、资源用量符合...

迁移Batch批量计算到分布式工作流Argo集群

数据存储 确保分布式工作流Argo集群可以访问工作流运行所需要的数据,工作流集群可以挂载访问阿里OSS、NAS、CPFS、盘等存储资源。更多信息,请参见 使用存储卷。测试验证 验证工作流运行正常、数据访问、结果输出正常、资源用量符合...

什么是企业级分布式应用服务EDAS

企业级分布式应用服务EDAS(Enterprise Distributed Application Service)是一个应用托管和 微服务 管理的 原生 PaaS 平台,提供应用开发、部署、监控、运维等全栈式解决方案,同时支持Spring Cloud和Apache Dubbo(以下简称Dubbo)等微...

分布式训练框架StarServer

分布式训练框架用于加速模型训练、处理海量数据并提高系统稳定性和资源利用率。它通过将模型分布在多个计算节点上实现并行计算,从而缩短训练时间,适应大数据集和大模型的训练需求。本文介绍如何使用分布式训练框架StarServer进行分布式...

分布式通信框架gRPC+

使用 DLC 进行深度学习训练时,您可以使用gRPC+分布式训练,从而加速模型训练。本文介绍如何开启分布式通信框架gRPC+。gRPC+通过Sharing Nothing架构、BusyPolling机制、用户态零拷贝及Send/Recv融合等多种优化技术,降低了E2E的通信延时,...

企业级分布式应用服务

企业级分布式应用服务EDAS(Enterprise Distributed Application Service)是一个应用托管和微服务管理的PaaS平台,提供应用开发、部署、监控、运维等全栈式解决方案,支持Spring Cloud、Dubbo等微服务运行环境,助力您的应用轻松上云。

快速体验分布式事务

您可以通过入门基础样例快速体验如何使用 GTS 实现分布式事务。基础样例简介 样例工程模拟了资金转账的应用。包含 2 个数据源:账户 A 数据源:存储 A 的资金。账户 B 数据源:存储 B 的资金。通过 GTS 管理的分布式事务,保障账户 A 和 B ...

分布式任务调度系统权限策略参考

本文描述分布式任务调度支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里访问控制(RAM)...

企业级分布式应用服务的审计事件

操作审计记录了用户通过OpenAPI或控制台等方式操作资源时产生的管控事件,企业级分布式应用服务支持在操作审计中查询的事件如下表所示。事件名称 事件含义 AbortAndRollbackChangeOrder 终止并回滚变更单。AbortChangeOrder 终止变更流程...

企业级分布式应用服务系统权限策略参考

本文描述企业级分布式应用服务支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里访问控制...

设置分布式事务白名单

该接口用于为RDS SQL Server实例设置分布式事务白名单。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。设置分布式事务白名单 ...

分布式训练服务PAI-DLC设置报警

监控为分布式训练服务PAI-DLC设置至少一条报警规则,视为“合规”。风险等级 默认风险等级:中风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 在监控为分布式训练服务PAI-DLC设置至少一条报警规则,视为“合规”。...

DescribeGlobalDistributeCache-查询分布式实例的详细...

查询分布式实例的详细信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素...

分布式深度学习训练加速(EPL)

EPL(Easy Parallel Library)是高效易用的分布式模型训练框架,深度集成多种训练优化技术,提供了简单易用的API实现各种并行化策略。您可以使用EPL实现低成本、高性能分布式模型训练。本文为您介绍如何在DLC中使用EPL高效地进行分布式...

分布式任务调度自定义权限策略参考

本文介绍分布式任务调度使用自定义权限策略示例。什么是自定义权限策略 在基于RAM的访问控制体系中,自定义权限策略是指在系统权限策略之外,您可以自主创建、更新和删除的权限策略。自定义权限策略的版本更新需要由您来维护。创建自定义...

设置分布式事务白名单

该接口用于为RDS SQL Server实例设置分布式事务白名单。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。设置分布式事务白名单 ...

设置分布式事务白名单

该接口用于为RDS SQL Server实例设置分布式事务白名单。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。设置分布式事务白名单 ...

企业级分布式应用服务自定义权限策略参考

本文介绍企业级分布式应用服务使用自定义权限策略示例。EDAS内置权限管理和RAM权限管理 EDAS内置了一套权限管理系统,有接入了阿里访问控制RAM(Resource Access Management)的权限管理。RAM权限管理操作,请参见 RAM简介。EDAS内置权限...

查询RDS实例的分布式事务白名单信息

该接口用于查询RDS SQL Server实例的分布式事务白名单信息。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。SQL Server 设置...

NLP:TorchAcc提速BERT Base分布式训练

本文为您介绍如何在BERT-Base分布式训练中接入TorchAcc并实现训练加速。测试环境配置 测试环境配置方法,请参见 配置测试环境。本案例以 DSW 环境V100M16卡型为例,例如:节点规格选择 ecs.gn6v-c8g1.16xlarge-64c256gNVIDIA V100*8。接入 ...

AIGC:TorchAcc提速Stable Diffusion分布式训练

本文为您介绍如何在Stable Diffusion分布式训练中接入TorchAcc并实现训练加速。测试环境配置 测试环境配置方法,请参见 配置测试环境。本案例以 DSW 环境V100M16卡型为例,例如:节点规格选择 ecs.gn6v-c8g1.16xlarge-64c256gNVIDIA V100*8...

将存量实例转换为分布式实例中第一个子实例

将一个存量的Tair内存型(经典版)实例转换为分布式实例中第一个子实例。接口说明 您可以调用本接口指定一个已有的实例转换为分布式实例中第一个子实例,转换完成后,该实例所属的分布式实例即被创建成功。待转换的实例需满足下述要求:待...

查询RDS实例的分布式事务白名单信息

该接口用于查询RDS SQL Server实例的分布式事务白名单信息。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。SQL Server 设置...

查询RDS实例的分布式事务白名单信息

该接口用于查询RDS SQL Server实例的分布式事务白名单信息。接口说明 适用引擎 RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。SQL Server 设置...

eRDMA:使用高性能网络进行分布式训练

PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。使用限制 仅适用于基于通用计算资源(预付费)提交的训练作业。仅适用于2....

分布式框架Ray

什么是AnalyticDB Ray 开源 Ray 是一款专为 AI 与高性能计算设计的分布式计算框架,通过简洁的 API 抽象实现高效的分布式调度,用户仅需几行代码,即可将单机任务扩展至千节点集群,能够像调用本地函数一样调度远程资源。其内置模块(如Ray...

分布式常见问题

本文围绕数据库运维与开发中最易遇到的三大类问题——事务、DDL以及节点管理进行归纳与解析具体问题如下:事务常见问题 DDL常见问题 节点常见问题
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用