异常处理机制故障原因

_相关内容

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

集群异常状态

状态一:不活跃(inactive)“不活跃(inactive)”状态可能由不同原因导致,您可以通过状态代码判断具体的异常原因。状态代码:KMSIndebtOverdue 异常原因 集群开启了使用阿里云密钥管理服务KMS进行Secret的落盘加密功能,且由于阿里云...

端口健康检查异常导致EDAS应用变更失败

解决方案 请参见 无法访问ECS集群的应用端口,排查端口异常原因并进行解决,处理完成后,再次部署应用,如果还是异常,请执行下一步。查看应用日志是否有相应的异常日志,如何查看日志,请参见 EDAS如何使用日志文件排查问题。根据异常日志...

故障处理流程

SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,查看运营商网络状态。硬件排查。查看安全组规则...

使用实例诊断

实例诊断是对云产品实例进行全方位的诊断体检,范围包括但不限于实例的配置、状态、资费、安全策略等多种诊断项,并提供诊断结果以及异常修复方案。背景信息 实例诊断支持诊断的实例类型如下所示:传统型负载均衡CLB(Classic Load ...

通过智能洞察排查异常情况

相关文档 为避免在出现异常后被动诊断异常原因,您还可以使用智能洞察的订阅功能针对不同的事件类型添加订阅规则,即可在出现异常时向运维团队发送通知。创建订阅规则的操作,请参见 订阅规则。智能洞察内置了多种巡检模块,您可以根据巡检...

创建MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

使用Prometheus配置报警规则的最佳实践

异常类别 详细描述 重要级别 PromQL配置 规则说明 常见处理SOP流程 容器副本异常 Pod状态异常 Critical min_over_time(sum by(namespace,pod,phase)(kube_pod_status_phase{phase=~"Pending|Unknown|Failed"})[5m:1m])>0 最近5分钟Pod的...

AI助手使用说明

异常处理:通过告警触发PAI创建Checkpoint并快速恢复任务。配置方法 安装ack-lingjun-aiast组件。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 ...

CloudLens概述

CloudLens基于日志服务构建统一的云产品可观测能力,通过日志、指标、配置计量等数据的关联分析,提供阿里云产品的用量分析、性能监控、安全分析、数据保护、异常检测、访问分析等服务。从成本、性能、安全、数据保护、稳定性、访问分析六...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

常见问题

资源本地化异常,该如何处理?Container启动失败或运行异常,报错提示No space left on device,该如何处理?节点NM服务或任务运行时无法正常解析域名,该如何处理?NM组件OOM如何处理?ECS实例重启后NM启动失败:cgroup目录丢失,如何处理...

Quick BI v4.6.3版本说明

支持配置波动分析,提供对异常指标的波动解读,帮助快速定位异常原因。支持未获取到数据、查询报错等异常情况通知到指标监控所有者。告警信息支持携带监控指标缩略图,提高告警信息可读性。我的看板中支持展示指标监控(仅专业版支持)。...

基于Client SDK数据写入

说明 通过 e.getErrData()即可获得异常数据List,此错误码在 addMap(s)、addRow(s)、commit 操作的时候都可能会发生,因此在这些操作的时候需要单独处理此错误码的异常 COMMIT_ERROR_OTHER 102 commit中的其他异常。ADD_DATA_ERROR 103 add...

通过调用链路和日志分析定位业务异常问题

定位业务异常问题难度大、效率低,为了解决这一难题,ARMS应用监控通过结合调用链路和日志分析,可以快速、准确地定位业务异常问题,提升微服务框架下的诊断效率。前提条件 已开通日志服务SLS。登录 日志服务控制台 时,根据页面提示开通...

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

审批负责人治理(Beta)

异常原因 系统检测到审批负责人异常的可能原因(优先级依此降低):同时具备生产和开发环境时,生产表的审批负责人与开发表的审批负责人不相同。表(开发环境/生产环境)的审批负责人对应的云账号不复存在。表(开发环境/生产环境)的审批...

运维监控概述

运维监控能够帮助您根据指定时间段内和指定项目下查看API在生产环境的调用情况,以便您及时发现并处理异常。权限说明 超级管理员 支持查看及管理所有数据服务项目的API调用情况。运维用户 支持查看和管理自己所负责的所有数据服务项目的API...

JindoSDK访问OSS出现Reached timeout问题

异常栈有getFileStatus字样 异常原因 通常是由于Bucket打开了多版本功能。解决方法 需确认是否打开或曾经打开过多版本功能。联系OSS 技术支持,确认该Bucket或路径下是否有10万以上的DeleteMarker,如果有则需要进行清理。rm命令 rm命令带...

一键诊断

节点在线状态检测会自动检测指定时间段内的Executor节点状态,若Executor节点不健康,则会提示检测异常,从而帮助您判断问题时段的异常原因。CPU使用率倾斜检测 检测不同Executor节点间CPU使用率是否均衡,若所有Executor节点的最高CPU使用...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

SQL请求行为识别

单击 异常检测 区域,弹出异常检测下拉列表,单击 异常发现 页签,通过查询 异常分析 部分内容获取异常原因。通过 异常指标 部分选择具体类别指标,查看该类指标的异常指标时间分布情况。说明 如上图所示,自动锚点后小红点代表异常程度的...

智能瓶颈分析

智能瓶颈分析通过在压测期间对服务端应用定时巡检,自动发现的异常问题,并给出...单击 疑似根因,可以对异常原因做进一步的下钻分析。单击 链路详情,可以跳转到具体的异常调用链。展开可查看方法栈和对应时段的监控指标。方法栈 监控指标

专家成长计划技术培训课程

1、网络安全产品攻击防护应用技巧(比如CC攻击防护)2、异常诊断分析(比如异常拦截原因分析及处理)3、产品使用技巧/最佳实践 现场面授(特殊情况可调整为线上钉钉群直播)云计算运维安全认证专家培训&CCSOP认证 4天 30人 本课程是云计算...

慢查询检测

慢查询检测功能用于检测并查询实例中存在的异常请求,并返回详细的查询结果。您可以通过该功能整体定位实例中的异常请求,结合业务需求及时调整或优化,避免慢查询影响业务处理能力。前提条件 已登录目标实例的集群管理系统,具体操作请...

质量大盘

质量大盘为您展示质量规则校验的表数、校验结果为异常的表数、规则应用趋势、规则异常趋势,帮助您从整体质量规则校验结果的视角出发,快速识别并处理异常的校验结果。质量大盘介绍 质量大盘页面默认为您展示今日的全局质量监控数据,请...

质量大盘

质量大盘为您展示质量规则校验的表数、校验结果为异常的表数、规则应用趋势、规则异常趋势,帮助您从整体质量规则校验结果的视角出发,快速识别并处理异常的校验结果。质量大盘介绍 质量大盘页面默认为您展示今日的全局质量监控数据,请...

查看异常统计

异常统计为您展示全局或已选项目下运行异常任务的统计信息,包括运行出错和运行总时间过长两个视角,便于您及时获取任务运行的状况,以判断资源的消耗及影响,从而作出预算准备、资源扩容或规格升级的决策。本文为您介绍运维中心的异常统计...

查看异常统计

异常统计为您展示全局或已选项目下运行异常任务的统计信息,包括运行出错和运行总时间过长两个视角,便于您及时获取任务运行的状况,以判断资源的消耗及影响,从而作出预算准备、资源扩容或规格升级的决策。本文为您介绍运维中心的异常统计...

查看告警信息

监控告警配置完成后,您可以在 指标监控 管理页面查看所有指标的 告...数据解读 当您在查看指标异常数据时,可以 单击对应数据,在详情页面下方 数据解读 区域中会展示对应的 数据异常原因,单击右上角 前往来源报表 将会跳转至对应的报表中。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

性能异常检测

异常点信息 区域,单击异常指标的 诊断,在 诊断树 页面,查看发生异常时数据库实例的性能全貌,快速定位数据库实例的异常原因。监控指标 DAS目前支持以下指标的异常检测。指标 含义 tps TPS。qps QPS。active_session 当前活跃会话。...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

常见状态码

基线dex处理异常/加载阶段的code说明 分三部分dex加载,resource加载,lib加载/dex加载 int CODE_LOAD_UNDEFINED=71;未定义异常 int CODE_LOAD_AES_DECRYPT=72;aes对称解密异常 int CODE_LOAD_MFITEM=73;补丁SOPHIX.MF文件解析异常 int CODE_...

图片处理

图片处理是OSS提供的海量、安全、低成本、高可靠的图片处理服务。原始图片上传到OSS后,您可以通过简单的RESTful接口,在任何时间、任何地点、任何互联网设备上对图片进行处理。注意事项 使用本文示例前您需要先通过自定义域名、STS等方式...

订阅

收到告警后,单击 详情 即可前往资金安全监控平台处理异常。可以订阅如下三种类型的通知:核对点通知:核对点状态(上下线或修改)变更时触发通知。异常通知:核对任务执行出现异常时触发通知。任务通知:核对任务执行结果为失败时触发通知...

安骑士的审计事件

OperationSuspEvents 批量处理异常事件。Renew 实例或者资源包等的续费操作。RenewInstance 实例续费。RollbackSuspEventQuaraFile 取消对文件隔离箱中文件的隔离。SaveSuspEventUserSetting 修改异常事件通知时间关注等级以及通知方式。...

时序异常检测

本文介绍异常检测算法的概念和时序异常检测的语法。引擎与版本 时序异常检测仅支持时序引擎。无版本要求。使用限制 时序异常检测必须和 SAMPLE BY 语句搭配使用。功能简介 时序异常检测用于检测指定时间线上异常点的值,支持阿里达摩院自研...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用