分布式云平台

_相关内容

分布式工作流Argo集群概述

分布式工作流Argo集群(简称 工作流集群 或Serverless Argo Workflows)采用无服务器模式,使用阿里容器计算服务ACS/弹性容器实例ECI运行工作流,通过优化开源工作流引擎性能及Kubernetes集群参数,实现大规模工作流的高效弹性调度,同时...

开通Argo Server公网访问

前提条件 已创建分布式工作流Argo集群。已完成RAM用户授权。已安装阿里CLI 3.0.172或以上版本 并 配置凭证。开通Argo Server公网访问 执行以下命令,获取集群基本信息,并记录集群ClusterID。aliyun adcp DescribeHubClusters-Profile=...

DLC概述

分布式训练DLC(Deep Learning Containers)可以帮助您快捷地创建单机或分布式训练任务,其底层使用Kubernetes拉起计算节点。这避免了您手动购买机器并配置运行环境,同时无需改变使用习惯。适用于需要快速启动训练任务的用户,支持多种...

Golang SDK接入

本文介绍如何将Golang应用通过SDK快速接入SchedulerX。控制台配置 请参见 创建应用,创建一个普通应用,并参见...后续步骤 应用接入SchedulerX完成后,即可在分布式任务调度平台创建调度任务。更多信息,请参见 创建调度任务。相关文档 Golang

使用流程

本文为您介绍分布式训练(DLC)完整的使用流程。在模型训练阶段,您可通过DLC发起大规模的分布式训练任务。具体使用流程如下:提交训练任务前,需要完成以下准备工作:准备资源 支持使用灵骏智算资源(用于大模型的训练任务)和通用计算...

概述

TRaaS 技术风险防控平台,是以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,形成的解决用户上云和分布式改造过程中,可观测、故障应急、容灾、混沌工程、资金安全、压测等运维问题的平台产品。高可用管理平台 高可用管理平台(High ...

在本地接入公网环境

1.2.1及以上版本设置appKey-property name="appKey"value${appKey}/value/property/bean Spring Boot应用 在 application.properties 文件中添加如下配置:登录 分布式任务调度平台。在控制台顶部菜单栏,将地域切换为 公网。在左侧导航栏...

ACK One Fleet实例跨云平台或跨账号管理多集群实践

使用ACK One Fleet实例管理跨云平台的Kubernetes集群,包括公共云Kubernetes集群或IDC自建Kubernetes集群。方案优势 提供统一的控制台界面和API接口,支持对集群、计算、网络、存储、安全、监控、日志、作业、应用、流量等进行企业级的运维...

NLP:TorchAcc提速BERT Base分布式训练

本文为您介绍如何在BERT-Base分布式训练中接入TorchAcc并实现训练加速。测试环境配置 测试环境配置方法,请参见 配置测试环境。本案例以 DSW 环境V100M16卡型为例,例如:节点规格选择 ecs.gn6v-c8g1.16xlarge-64c256gNVIDIA V100*8。接入 ...

实例互联进行分布式训练

DSW提供了多实例互联的功能,帮助您在DSW中实现多机多卡的分布式开发和训练。前提条件 基于通用计算资源组或灵骏智算资源组的多个实例,且位于相同VPC中;实例所属资源组的公网访问网关配置为 专有网关;实例位于相同的集群(如:灵骏实例...

品牌升级

分布式关系型数据库服务DRDS目前已品牌升级至原生分布式数据库 PolarDB-X。PolarDB-X 融合分布式SQL引擎与分布式自研存储X-DB,专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及...

专有通用架构

Apsara Stack Enterprise Apsara Stack Enterprise 是面向中大型企业客户的全栈云平台,基于阿里云产品的分布式架构,与阿里公共云同一体系,针对企业级市场的使用特点,为客户提供一个开放、统一、可信的企业级云平台。集群规模大于50台...

网商银行

客户价值 网商银行信息系统建设依托于蚂蚁集团成熟的、完全“自主可控”的技术体系,结合自身轻资产、交易型、平台化的运营思路,完成了基于分布式云计算的架构建设。提高了系统吞吐能力、资源供给效率以及系统可靠性,做到了 7x24x365 的...

【公告】PolarDB服务等级协议(SLA)变更

以下独立的 原生数据库PolarDB分布式版 SLA将会下线:原生分布式数据库PolarDB-X服务等级协议 原生分布式数据库PolarDB-X服务等级协议(金融版)变更影响 PolarDB for Xscale 2.0的服务可用性承诺最高从“99.99%”调整至“99.995%...

HDFS

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

什么是工作流(CloudFlow)

工作流(CloudFlow)是一个用来协调多个分布式任务执行的全托管云服务。在 工作流 中,您可以用顺序、分支、并行等方式来编排分布式任务,工作流 会按照设定好的步骤可靠地协调任务执行,跟踪每个任务的状态转换,并在必要时执行您...

服务等级协议

请参见 原生分布式数据库PolarDB-X服务等级协议。

SDS分布式存储

阿里分布式存储技术以及积累的公共部署、运维的最佳实践融入到分布式存储产品中,从而打造高性能、高可扩展、高可靠的 SDS分布式存储,帮助您降低成本、缩短业务上线时间,轻松构建混合存储。产品优势 灵活敏捷,弹性扩容 3节点...

原生分布式数据库PolarDB-X 1.0和2.0区别

概述 本文主要介绍原生分布式数据库PolarDB-X 1.0和2.0的区别。详细信息 PolarDB-X提供1.0中间件形态,以及2.0一体化形态,具体区别如下:PolarDB-X 1.0中间件形态由计算层PolarDB-X实例与存储层私有定制RDS实例组成,通过挂载多个MySQL...

什么是实时监控

实时监控是阿里金融分布式架构的核心运维组件。本文系统阐述其核心概念、关键优势与应用场景,为构建高效、稳定的运维体系奠定基础。

原生分布式数据库 PolarDB-X系统权限策略参考

本文描述原生分布式数据库 PolarDB-X支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里...

原生分布式数据库 PolarDB-X系统权限策略参考

本文描述原生分布式数据库 PolarDB-X支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里...

创建工作流

前提条件 已创建分布式工作流Argo集群 已完成RAM用户授权 使用说明 工作流ServiceAccount 工作流可指定ServiceAccount用于运行中访问其他Kubernetes资源,您可以创建自己的ServiceAccount,工作流集群会为ServiceAccount自动绑定权限,若...

核心监控指标与告警实践

围绕 PolarDB分布式版 的关键组件,通过监控服务配置告警规则,可实现对系统健康状况的自动化监测。计算节点(Compute Node,CN):无状态的SQL代理层,负责SQL解析、优化、执行和结果合并。其性能主要受CPU和JVM内存影响。存储节点...

管理报警规则

说明 在 关联资源 区域,选择 产品 为 原生分布式数据库PolarDB-X 1.0。关于其它参数的设置,详情请参见 创建报警规则。单击 确认 即可。报警规则管理 登录 PolarDB分布式版控制台。在页面左上角选择目标实例所在地域。在 实例列表 页,...

块存储概述

ESSD系列盘类型 特点 应用场景 计费 ESSD盘 高IOPS 低延迟 时延敏感的应用或者I/O密集型业务场景:大型OLTP数据库 NoSQL数据库 Elasticsearch分布式日志 盘容量费 ESSD AutoPL盘 容量与性能可解耦 支持预配置盘性能(允许在...

接入上ECS算力

控制不同成本的计算资源供给(例如抢占实例、包年包月实例等)的优先级顺序,以降低成本。根据工作负载需求,按比例分配不同类型的实例,例如x86架构和Arm架构的使用比例。节点池创建流程 节点池基础功能 ACK One注册集群 在节点池维度...

分布式任务调度

SchedulerX是阿里巴巴自研的基于Akka架构的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、K8s Job、Spring Schedule,支持Cron定时、一次性任务、任务编排、分布式数据处理,具备高可用、可视化、可运维、低延时等能力。

注册集群快速入门

ACK One注册集群 帮助您将下Kubernetes集群接入云端,快速搭建混合云集群,可以将本地数据中心Kubernetes集群或其他厂商Kubernetes集群接入阿里容器服务管理平台,进行统一管理。本文介绍 ACK One注册集群 的快速使用流程和文档使用...

Knative概述

Knative是基于Kubernetes的Serverless框架,旨在制定原生、跨平台的Serverless编排标准。它整合容器构建、工作负载管理和事件模型,帮助您部署和管理Serverless工作负载,打造企业级Serverless平台。组件介绍 阿里容器服务Knative完全...

使用前必读

您可以将本地数据中心Kubernetes集群或其他厂商Kubernetes集群接入阿里容器服务管理平台,进行统一管理。本文介绍使用注册集群前需要了解的一些注意事项。数据安全相关 ACK One注册集群 支持受限模式,在自建Kubernetes集群中部署的ack...

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴自研的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、Spring Schedule,K8s Job,支持Cron定时、一次性任务、可视化工作流任务编排和分布式跑批,具有高可用、可观测、可运维和低延时等能力。...

支持的云服务

开放搜索OpenSearch 开放搜索OpenSearch是一款阿里自主研发的大规模分布式搜索引擎平台。您通过MaxCompute对数据进行计算处理后,可以在OpenSearch平台上通过添加数据源的方式将MaxCompute数据接入,详情请参见 MaxCompute数据源配置。更...

互联网银行解决方案

金融级分布式架构,快速迭代、弹性扩展 经济性:高可靠、高性能、低成本,灵活扩展 方案优势 金融级原生架构体系 技术上引入阿里“全家桶”原生架构技术体系,包括飞天平台、企业级分布式架构平台、OceanBase 数据库、大数据平台、移动...

从单体到云平台到金融级混合云

第四阶段:云平台 蚂蚁的技术架构在第四阶段的时候演变成为云平台架构,而且为了应对互联网业务形态下突发性业务对资源的弹性需求,蚂蚁也在同一阶段将架构直接进化成弹性混合云架构。第五阶段:云原生 现在蚂蚁已经演进到第五代云原生架构...

全场景解决方案

金融级分布式架构,快速迭代、弹性扩展 经济性:高可靠、高性能、低成本,灵活扩展 方案优势 金融级原生架构体系 技术上引入阿里“全家桶”原生架构技术体系,包括飞天平台、企业级分布式架构平台、OceanBase 数据库、大数据平台、移动...

命名空间管理

创建命名空间 登录 分布式任务调度平台。在顶部菜单栏选择地域。在左侧导航栏,单击 命名空间。单击 创建命名空间。在 创建命名空间 面板,输入命名空间的 名称 和 描述,然后单击 确定。命名空间创建成功,会提示 创建成功。返回 命名空间...

技术架构

架构演进理念 当前,分布式领域有3大技术方向:Sharding技术,NewSQL原生分布式技术,原生DB技术。每种分布式都有其独特的优势和特点。PolarDB-X 1.0 的架构继承了DRDS和X-DB技术的稳定性,结合了PolarDB的原生技术,融入了NewSQL对于...

顺德农商

解决方案 通过引入阿里“飞天”计算操作系统、分布式中间件体系 SOFAStack、分布式数据库平台 OceanBase、金融核心套件 bPaaS、mPaaS、金融数据智能平台、移动开发平台等,逐渐打造了覆盖底层 IDC 到上层移动应用在内的金融级全分布式...

通知历史

当通知发生后,您可以按照应用ID、任务ID、通知类型、通知渠道、通知状态...查看通知历史 登录 分布式任务调度平台。在顶部菜单栏选择地域。在左侧导航栏选择 通知管理 通知历史。在 通知历史 页面,通过筛选或搜索功能查找目标通知历史记录。
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用