本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...
常见问题及修复方案的更多信息,请参见 SMC FAQ 和 故障排除。使用sudo权限:sudo./go2aliyun_client-abort sudo./go2aliyun_client 使用root权限:./go2aliyun_client-abort./go2aliyun_client 后续步骤 导入迁移源后,您需要创建并启动...
故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点切回到生产站点的过程。正向保护 Forward 用于保护组和ECS的状态。生产站点数据和业务复制到容灾站点。反向保护 Reverse 用于保护组和ECS的状态。当故障切换后,容灾站点B变为...
故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点切回到生产站点的过程。正向保护 Forward 用于保护组和ECS的状态。生产站点数据和业务复制到容灾站点。反向保护 Reverse 用于保护组和ECS的状态。当故障切换后,容灾站点B变为...
背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 演练任务创建完成后,您可以直接执行演练。在左侧导航栏中选择 故障演练>我的空间。在演练列表中单击目标演练任务右侧 操作 栏的 ...
背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...
当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...
本文介绍网关一体机中磁盘故障、电源故障等硬件告警,以及CPU使用率、内存使用率等软件告警信息。监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一...
您可以根据以下两点规划交换机:使用一个VPC时,也请尽量使用至少两个交换机,并且将两个交换机分布在不同可用区,这样当其中一个可用区的交换机发生故障时,可以切换到另一个可用区的交换机,从而实现跨可用区容灾。同一地域不同可用区...
概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...
链路追踪:提供事件轨迹能力,还原事件整体链路状态,帮助您快速排除故障,定位链路问题。低成本 事件总线EventBridge 支持事件以云服务事件总线和自定义事件总线形式接入,云服务事件总线支持接入所有阿里云产品事件,无缝支持云服务事件...
当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...
容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...
容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
步骤四:创建保护组。步骤五:添加保护实例。添加需要保护的实例。步骤六:启动复制。开始容灾保护,即将生产站点数据复制到容灾站点。说明 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。具体操作,请参见 故障演练。...
步骤四:创建保护组。步骤五:添加保护实例。添加需要保护的实例。步骤六:启动复制。开始容灾保护,即将生产站点数据复制到容灾站点。说明 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。具体操作,请参见 故障演练。...
相关文档 介绍类:计费说明 终端节点服务概述 控制台操作类:加入和管理安全组 创建和管理终端节点网卡 允许和管理终端节点连接 API类:CreateVpcEndpoint:创建终端节点。ListVpcEndpoints:查询终端节点 UpdateVpcEndpointAttribute:...
本文主要介绍Windows操作系统云虚拟主机耗资源(客户程序故障)问题的原因分析及处理意见。调用Access程序问题(最常见)原因:Access数据库大小超过30M,频繁调用时耗用系统资源。解决方法:将数据库大小压缩到30M以内,或者升级到SQL ...
当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...
本文介绍SAG-1000设备发生设备和交换机之间链路故障的原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...
主节点对外提供服务,当主节点出现故障,系统自动切换备用节点接管服务,整个切换过程对用户全部透明。电商行业应用 电商行业通过Redis实现商品秒杀、购物推荐等功能。场景一:秒杀类购物系统 大型促销秒杀系统,系统整体访问压力非常大,...
高可靠:在宕机、网络故障等情况下,严格保证数据一致性。节约成本:节省运维成本,避免了分布式场景下产生的数据异常。节省开发成本,像使用单机事务一样使用分布式事务。推荐搭配 ECS 和 MQ 使用。通用分布式事务管理 提供通用的分布...
说明 10/100/1000M电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,最大传输距离100m。如果线缆长度大于100m可以采用如下方式:缩短设备间距离,以缩短双绞线长度。如果不能改变设备间的距离,设备之间可以通过中继器、HUB或交换机...
说明 10/100/1000 Mbps电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,此类双绞线最大传输距离为100米。如果线缆长度大于100米可以采用如下方式:缩短设备之间距离以缩短双绞线长度。如果不能改变设备之间的距离,设备之间可以通过...
高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。
因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求会更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...
故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...
右键维值 操作内容 单维值 两维值 多维值 隐藏 支持 不支持 不支持 仅保留 支持 支持 支持 排除 支持 支持 支持 抑制 支持 支持 支持 计算 支持(自定义计算)支持(百分比、差异百分比、四则运算)支持(总和、平均值、最值)移除维值 ...
弹性裸金属服务器(ECS Bare Metal Instance,简称为EBM)是一款同时兼具虚拟机弹性和物理机性能及特性的新型计算类产品,是基于阿里云完全自主研发的下一代虚拟化技术而打造的新型计算类服务器产品。EBM详情,请参见 弹性裸金属服务器概述...
存储节点与元数据服务节点分别将三类节点分配在三个不同的可用区中,Leader节点在主可用区,Follower节点在备可用区,Logger节点在第三个可用区。说明 主备切换步骤请参见 主备切换。容灾能力 计算节点容灾能力 单可用区故障 主可用区故障...
本地盘是ECS实例所在物理机上的本地硬盘设备。相比云盘,本地盘具有较高的存储I/O性能,但同时也有更大的数据风险。本文介绍如何正确选择本地盘,以及如何降低本地盘数据风险。什么是本地盘 本地盘是ECS实例所在物理机上的本地硬盘设备,...
背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障等消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉小程序,您只需要配置小程序,...
标准架构单副本类型的适用场景:纯缓存类业务场景 单副本架构不能提供数据可靠性,如果发生节点故障,您需要重新对业务进行预热,因此,在对数据可靠性要求较高的敏感性业务中,建议选用双副本架构。对Redis协议兼容性要求较高的业务 标准...
三副本原理 在阿里云数据存储平台中,有三类角色,分别为Master、Chunk Server和Client。您的一个写操作最终由Client执行,执行过程简要说明如下:Client收到写操作请求,并计算出写操作对应的Chunk。Client向Master查询该Chunk的三份副本...
您只需要依次执行以下六个步骤即可实现对关键应用的容灾保护,操作流程如下图所示:步骤一:搭建云上专有网络 准备好用于容灾的云上专有网络(VPC)和交换机(vSwitch),并配置好网段。测试使用时,您可以使用默认配置来创建VPC和vSwtich...
本文列出了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...
另一方面是在⼀个数据中心发⽣故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,实现用户的故障无感知。两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据...
实现链路冗余大体可以分为以下几类:双专线冗余:通过两条专线与IDC/其它云互通,其中一条链路中断可以快速切换到另外一条线路,需要注意在进行专线接入的时候尽可能选择两个不同的专线接入点提升高可用。如果为了满足业务对延迟等需求,...
特点 可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主节点对外提供访问,用户可通过Redis命令行和通用客户端进行数据的增删改查操作。当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳...