本地服务的可用性监控可以帮助您快速发现本地服务无响应的情况,并能够在出现响应超时或状态码错误时,给您发送报警通知。前提条件 本地服务的可用性监控依赖云监控插件,被监控主机需要安装云监控插件。请确保您已安装云监控插件。具体...
可用性监控为您定期探测本地或远程指定路径和端口是否正常响应。当出现响应超时或状态码错误时,云监控发送报警通知,帮助您快速发现本地或远程服务无响应的情况。背景信息 可用性监控支持创建从探测源(云服务器ECS)到探测目标(URL或IP...
云监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...
在目标应用分组的左侧导航栏,单击 可用性监控。单击 添加可用性监控。在 创建/修改可用性监控 面板,设置任务相关参数。参数 描述 任务名称 可用性监控的任务名称。探测源 待探测的实例ID。探测目标 待探测目标。取值:URL或者IP:仅用于...
JS错误诊断 展示JS稳定性监控指标:页面错误率排行、高频错误和错误分布。说明 基础版不支持 查看会话。API请求 展示API请求监控指标:API请求成功率、API耗时情况、API返回信息聚类。API详情 提供指定时间段内应用中所有API请求的成功率、...
从系统稳定性角度来看,IO HANG可能会引起大量的进程进入等待状态,导致系统高负载,甚至系统夯住,shell命令无法执行,机器无法登录,最终必须重启系统。IO HANG诊断的作用 IO HANG诊断可用于检测当前系统中的IO HANG事件并确定问题边界,...
发布时间 发布地域 相关文档 智能阈值 智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,他自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。...
调用DescribeHostAvailabilityList接口查询可用性监控任务列表。接口说明 本文将提供一个示例,查询当前账号的可用性监控任务列表。返回结果显示,当前账号存在一条可用性监控任务记录 ecs_instance。调试 您可以在OpenAPI Explorer中直接...
建议您选择实例数量最多的地域作为访问点,若您选择其他地域可能会影响访问速度和系统稳定性。选择要聚合的实例 选择 其他账号(资源目录),选择 资源目录成员账号,添加目标Prometheus实例。说明 选择其他账号(资源目录)后,可观测监控...
您通过可用性监控功能探测指定路径或端口的可用性时,如果探测异常,会返回相应状态码。状态码说明如下表所示。协议类型 状态码 含义 HTTP 610 超时。发出HTTP请求后5秒内无响应,视为超时。611 探测失败。Telnet 630 超时。发出Telnet请求...
建议您选择实例数量最多的地域作为访问点,若您选择其他地域可能会影响访问速度和系统稳定性。选择要聚合的实例 选择 其他账号(资源目录),选择 资源目录成员账号,添加目标Prometheus实例。说明 选择其他账号(资源目录)后,可观测监控...
20000个 一个阿里云账号的一个应用分组内允许新建的可用性监控数量。500个 主机监控 一个阿里云账号允许管理的非阿里云主机数量。15000个 企业云监控 功能 限制项 最大值 指标仓库 一个阿里云账号允许新建的指标仓库数量。30个 一个阿里云...
应用分组的可用性监控报警和组进程监控报警、云产品监控指标报警、站点监控报警、企业云监控的promQL报警,不论单指标、多指标、复杂的表达式和同比环比等都是有固定阈值的表达式。以下两种情况均以单指标的简单表达式进行介绍。问题1:...
调用EnableHostAvailability接口启用指定可用性监控任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在...
调用DisableHostAvailability接口禁用指定可用性监控任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在...
调用CreateHostAvailability接口创建可用性监控任务。接口说明 本文将提供一个示例,在应用分组 123456 中创建探测类型为 HTTP 的可用性监控任务 task1,通过邮件和钉钉机器人给您发送报警。调试 您可以在OpenAPI Explorer中直接运行该接口...
调用ModifyHostAvailability接口修改可用性监控任务。接口说明 本文将提供一个示例,将应用分组 123456 中可用性监控任务 12345 的名称修改为 task2。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,...
调用DeleteHostAvailability接口删除可用性监控任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM...
重要 如果CPU持续保持高使用率,则会对系统稳定性和业务运行造成影响。您可以参见以下方法进行优化:Linux实例请参见 Linux系统CPU负载的查询和案例分析。Windows实例请参见 Windows实例中CPU使用率较高问题的排查及解决方法。网络流量:...
在目标应用分组的左侧导航栏,您可以根据所需查看该应用分组的 组内资源、监控视图、故障列表、可用性监控、组进程监控、系统事件、自定义事件、日志监控、自定义监控、报警历史、报警规则 和 业务监控。功能 说明 组内资源 您可以查看目标...
ARMS前端监控专注于对Web场景、Weex场景和小程序场景的监控,从页面打开速度(测速)、页面稳定性(JS诊断错误)和外部服务调用成功率(API)这三个方面监测Web和小程序页面的健康度。为什么要有前端监控?用户访问您的业务时,整个访问...
开箱即用 稳定性保障 规模无上限 基于探针技术,在运行态进行字节码增强,无需修改代码,实现应用性能管理能力。容器服务ACK和ECS环境下探针自动注入,一键接入,支持探针自动升级。从探针注入、数据计算、数据存储、可视化呈现,到告警...
注意事项 重要 由于云监控实时数据导出工具部署并运行在客户本地,云监控无法确保工具运行的稳定性,需要客户自行维护。如果您发现工具有问题,则可以给云监控提改进意见。云监控不对产生的任何意外损失负责。背景信息 开通企业云监控不会...
产品计费 用户体验监控 专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)...
mcac_table_waiting_on_free_memtable_space Major 等待释放MemTable花费的时间 该指标过高会导致数据写入性能下降,节点稳定性下降。线程池状态 指标名称 重要级别 指标描述 指标说明 mcac_thread_pools_active_tasks Critical 线程池中...
mcac_table_waiting_on_free_memtable_space Major 等待释放MemTable花费的时间 该指标过高会导致数据写入性能下降,节点稳定性下降。线程池状态 指标名称 重要级别 指标描述 指标说明 mcac_thread_pools_active_tasks Critical 线程池中...
新增 根据SLA进行自监控指标埋点,SLA稳定性大盘数据。新增 ServiceMonitor支持BasicAuth认证方式,Secret需要与ServiceMonitor在同一个命名空间下使用。新增 Metrics Metadata能力展示具体指标含义。新增 支持传递Agent Chart版本到服务端...
新增 根据SLA进行自监控指标埋点,SLA稳定性大盘数据。新增 ServiceMonitor支持BasicAuth认证方式,Secret需要与ServiceMonitor在同一个命名空间下使用。新增 Metrics Metadata能力展示具体指标含义。新增 支持传递Agent Chart版本到服务端...
Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...
Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...
提供多集群、集群、应用等多视角进行对比分析,让运维人员切实感知 PaaS 层稳定性。Prometheus 监控 支持采集符合 Open-Metrics 的 Prometheus 指标,作为统一标准格式存储为时序数据,并提供可视化大盘配置。蚂蚁产品监控 原生采集 SOFA ...
为了不断提升产品能力以及稳定性,ARMS团队会保持对应用监控的快速迭代,并定期发布新版本的探针。建议您跟随ARMS的探针发布节奏,及时更新探针版本。及时更新探针版本,可以帮助您更好地使用ARMS:对ARMS新特性的支持。持续剖析、代码热点...
ARMS前端监控专注于对Web场景、Weex场景和小程序场景的监控,从页面打开速度(测速)、页面稳定性(JS诊断错误)和外部服务调用成功率(API)这三个方面监测Web和小程序页面的健康状况。适用JavaScript的前端应用场景。更多信息,请参见 ...
当数据点的异常突变超出预设的上下边界时,系统将生成区间异常检测事件,这种检测主要用于监控趋势稳定的数据或指标。应用场景 应用性能监控:网站管理员可以使用此功能来监测站点的响应时间、请求速度等黄金指标。当某个服务的响应时间...
当数据点的异常突变超出预设的上下边界时,系统将生成区间异常检测事件,这种检测主要用于监控趋势稳定的数据或指标。应用场景 应用性能监控:网站管理员可以使用此功能来监测站点的响应时间、请求速度等黄金指标。当某个服务的响应时间...
每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...
查询算法差异性:例如,高级监控和Kibana监控采集数据时都会受集群稳定性的影响,高级监控QPS指标会因集群的抖动会出现监控突增、负值或无监控等状况,而Kibana监控可能显示为空。说明 如果高级监控提供的指标比Kibana监控多,在实际使用时...
每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...
应用安全自身对性能、兼容性和稳定性有良好的控制,对应用运行的影响几乎可以忽略不计。实际测试中,CPU的额外开销小于1%,内存开销小于30 MB,应用延迟(RT)小于1 ms。此外,应用安全还提供观察模式、软熔断逃生机制等功能,最大限度降低...
变更三板斧“可灰度、可监控、可回滚”是保障线上稳定性的重要准则。其中,分批次灰度变更是降低线上风险、控制爆炸半径的关键手段。一旦发现灰度批次的服务状态异常,应及时进行回滚,而不是继续发布。然而,生产环境很多故障的发生都是...