系统性能监控工具-系统性能监控工具文档介绍内容-移动阿里云

什么是可观测监控 Prometheus 版

阿里云可观测监控 Prometheus 版全面对接开源 Prometheus 生态，支持类型丰富的组件监控，提供多种开箱即用的预置监控大盘，且提供全面托管的 Prometheus 服务。说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、...

告警中心

告警中心是系统中用于集中管理和展示各类告警信息的模块。它通过实时监控系统的运行状态、性能指标、异常事件等，及时发现并通知相关人员潜在的问题或风险。

2024年

PTS国际版支持场景编排、API调试、流量定制等功能，可快速创建压测脚本，精准模拟不同量级用户访问业务系统，帮助您快速提升系统性能和稳定性。PTS压测快速入门 2024年07月功能名称变更类型功能描述相关文档 Access Log 压测上线新增 ...

2024年

PTS国际版支持场景编排、API调试、流量定制等功能，可快速创建压测脚本，精准模拟不同量级用户访问业务系统，帮助您快速提升系统性能和稳定性。PTS压测快速入门 2024年07月功能名称变更类型功能描述相关文档 Access Log 压测上线新增 ...

创建聚合任务

通过配置聚合任务（Recording Rules）优化监控性能，降低PromQL复杂度，提升大规模集群查询效率。重要聚合任务只支持Prometheus V2版本的实例。背景信息聚合任务可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算...

创建聚合任务

通过配置聚合任务（Recording Rules）优化监控性能，降低PromQL复杂度，提升大规模集群查询效率。重要聚合任务只支持Prometheus V2版本的实例。背景信息聚合任务可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算...

什么是应用实时监控服务ARMS？

其覆盖浏览器、小程序、APP、分布式应用、容器等不同可观测环境与场景，帮助企业实现全栈性能监控与端到端追踪诊断。提高监控效率，减少运维工作量。产品架构 ARMS子产品计费详情请参见产品计费（新版）。子产品功能概述常见场景 ...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统，上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据，从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口云...

系统负载诊断

系统负载诊断的目的是分析系统在一分钟内的平均负载（load1指标）异常原因及其详细信息，并提供相应的处理建议。使用限制地域限制本功能目前仅支持中国内地与中国香港。权限限制若使用RAM用户，请确保阿里云账号（主账号）已将系统策略 ...

持续性能剖析

快捷筛选（图示③）快捷标签数据依赖于元数据的时间范围，标签键来源于性能监控数据中的 labels 字段（JSON格式）。不同标签之间为“与”的逻辑关系。选择标签后，系统将根据您所选择的标签自动更新趋势图和火焰图。主机地址：开始性能剖析...

不同性能压测工具对比

PTS支持的场景编排、API调试、流量定制、流量录制等功能，可快速创建业务压测脚本，精准模拟不同量级用户访问业务系统，帮助业务快速提升系统性能和稳定性。阿里云PTS具备如下特性：免运维、开箱即用 SaaS化施压、最大支持百万级并发、千万...

可观测性

基础设施层可观测性指容器服务ACK所依赖的底层资源的可观测场景：定位Pod与节点组成的资源池的调用链路，可视化拓扑关系，例如宿主机节点、网络基础组件的性能监控等。解决方案方案介绍适用场景参考文档架构可视化感知方案 Kubernetes...

什么是云监控2.0

云监控2.0借助AI增强的跨域智能洞察，能够实时分析和预测系统性能，提前识别异常情况，并提供智能化的故障诊断和优化建议，帮助企业在 AI-native 时代以更智能、更高效、更低成本的方式构建全栈可观测体系，为业务稳定性与安全性保驾护航。...

持续性能剖析

快捷筛选（图示③）快捷标签数据依赖于元数据的时间范围，标签键来源于性能监控数据中的 labels 字段（JSON格式）。不同标签之间为“与”的逻辑关系。选择标签后，系统将根据您所选择的标签自动更新趋势图和火焰图。主机地址：开始性能剖析...

OpenTelemetry Astronomy Shop Demo 接入指南

本文主要介绍 OpenTelemetry Astronomy Shop Demo（项目地址）在阿里云容器服务ACK部署完成后，在正式使用云监控2.0控制台前，如何将不同组件接入云监控2.0的容器洞察、应用监控、云服务监控、用户体验监控等。接入原理云监控2.0接入中心...

什么是性能测试PTS

PTS支持的场景编排、API调试、流量定制、流量录制等功能，可快速创建业务压测脚本，精准模拟不同量级用户访问业务系统，帮助业务快速提升系统性能和稳定性。前置概念阅读本文前，您可能需要了解如下概念：什么是SaaS？什么是CDN？什么是...

测试分析及调优

系统的性能是由很多因素决定的，本文很难面面俱到，但是可以作为分析系统性能的一个指导。适用对象和范围适用于需要进行性能分析及调优的工作。预期读者为测试管理人员、测试实施人员、技术支持人员、项目质量管理人员、项目管理人员等...

功能特性

授权用户管理账号 性能监控 性能监控功能可以实现对Grafana工作区性能的实时监控，以便发现异常时及时处理，从而保证Grafana工作区的可用性。查看性能监控 升级工作区配置告警管理 ARMS告警管理是开箱即用的智能告警服务，能够接收...

测试分析及调优

系统的性能是由很多因素决定的，本文很难面面俱到，但是可以作为分析系统性能的一个指导。适用对象和范围适用于需要进行性能分析及调优的工作。预期读者为测试管理人员、测试实施人员、技术支持人员、项目质量管理人员、项目管理人员等...

自助式部署 runtime

安装 agenthub agenthub 是为 Node.js 性能平台的常驻代理服务，可以帮助执行一些监控和诊断的操作，并且它包含一组 Node.js 性能平台服务执行任务所需要的命令集合，Node.js 性能平台有且仅有执行这些命令的权限。agenthub 同时是一个 npm...

测试与验证

监控性能指标监控指标包含业务监控指标、操作系统监控指标、中间件监控指标、数据库监控指标，旨在监控从各个维度描述压测时性能表现。构建性能测试数据测试数据主要包含两类：基础测试数据基础测试数据一般取自生产环境真实请求日志。...

功能特性

通过百万并发、千万TPS流量发起能力以及流量地域定制功能，可精准模拟真实的用户访问模型，帮助业务快速提升系统性能和稳定性。功能集功能功能描述参考文档 PTS压测创建PTS压测场景 PTS压测支持HTTP、HTTPS协议压测，广泛适用于Web应用...

实体拓扑

实体关联拓扑是云监控2.0的核心组件，通过直观的智能分层视图，查看和探索各实体依赖关系和指标，识别系统瓶颈与性能热点，快速定位异常传播路径和影响范围。功能入口登录云监控2.0控制台，进入任意工作空间（WorkSpace）。进入任意实体...

2.0和3.0版本差异及兼容性说明

辅助用户识别和优化慢请求，了解系统中的性能瓶颈。支持智能瓶颈分析：集成了智能异常检测和根因分析工具，辅助用户识别和定位潜在的性能瓶颈。2.0和3.0功能兼容说明性能测试 PTS 3.x版本基于大规模企业客户的生产实践经验，对压测引擎做...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

集成事件后管理更高效告警管理默认支持一键化集成阿里云常见的监控工具，并支持更多的监控工具手动接入，方便统一维护。事件接入模块稳定，能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

集成事件后管理更高效告警管理默认支持一键化集成阿里云常见的监控工具，并支持更多的监控工具手动接入，方便统一维护。事件接入模块稳定，能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

集成事件后管理更高效告警管理默认支持一键化集成阿里云常见的监控工具，并支持更多的监控工具手动接入，方便统一维护。事件接入模块稳定，能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知...

使用Prometheus监控ECS主机

本文介绍如何使用阿里云Prometheus监控ECS主机，以及配置主机监控组件、指标采集、告警的方案，以实现符合您所需...此外，进程状态指标增加了对系统资源的小额额外消耗，通常不会对系统性能造成显著影响，但在资源极为有限的环境中需要注意。

使用Prometheus监控ECS主机

本文介绍如何使用阿里云Prometheus监控ECS主机，以及配置主机监控组件、指标采集、告警的方案，以实现符合您所需...此外，进程状态指标增加了对系统资源的小额额外消耗，通常不会对系统性能造成显著影响，但在资源极为有限的环境中需要注意。

使用Prometheus监控ECS主机

本文介绍如何使用阿里云Prometheus监控ECS主机，以及配置主机监控组件、指标采集、告警的方案，以实现符合您所需...此外，进程状态指标增加了对系统资源的小额额外消耗，通常不会对系统性能造成显著影响，但在资源极为有限的环境中需要注意。

什么是应用监控

ARMS应用监控是一款应用性能管理（Application Performance Management，简称APM）产品。您无需修改代码，只需为应用安装一个探针，ARMS就能够对应用进行全方位监控，帮助您全面掌控应用运行状态，快速定位出错接口和慢接口，洞察性能瓶颈...

Java应用持续剖析

如需排查具体的热点代码逻辑，可以通过重点关注 Self 列或直接查看右侧火焰图中底部的较宽火苗从中定位到高耗时的业务方法，较宽火苗是引发上层耗时高的根源，一般是系统性能的瓶颈所在，您可以重点关注。图 2.指标列表图 3.快照列表相关...

接入持续剖析功能

如需排查具体的热点代码逻辑，可以通过重点关注 Self 列或直接查看右侧火焰图中底部的较宽火苗从中定位到高耗时的业务方法，较宽火苗是引发上层耗时高的根源，一般是系统性能的瓶颈所在，您可以重点关注。图 2.指标列表图 3.快照列表在...

使用代码热点诊断Java应用慢调用问题

作为排查具体的热点代码逻辑，可以通过重点关注 Self 列或直接查看右侧火焰图中底部的较宽火苗从中定位到高耗时的业务方法，较宽火苗是引发上层耗时高的根源，一般是系统性能的瓶颈所在，例如上图中的 java.lang.Thread.sleep()方法。...

概述

性能度量了系统在单元环境内承载工作负载的效率，系统性能通常可以由 QPS、并发和RT（响应时间）等典型指标来衡量。在传统 IT 环境中，系统的容量评估和规划是系统设计的重要环节，通常会基于系统对峰值负载表现出来的性能承载能力来给系统...

查看监控信息

需注意文件数量过多会增加管理复杂性并影响检索效率与性能，若超过预设阈值则需高度关注，建议定期整理存储内容，清除无用或冗余文件，以提升管理效率与系统性能。IOPS 表示该文件系统在周期内每秒平均读/写IOPS次数。单位为次/秒。延迟 ...

使用内存热点诊断堆内存使用高的问题

ARMS内存热点作为一种监控诊断工具，通过持续剖析技术记录线程每个触发堆内存分配阈值时的内存分配大小/次数，以及触发时刻的方法栈快照，定位JVM堆内存使用率高的根因。当系统JVM堆内存利用率高时，ARMS内存热点可为您快速定位到导致堆...

查看云盘监控信息

本文将指导您如何查看ECS实例的云盘监控信息，以帮助您有效确保系统性能和稳定性。背景信息衡量云盘性能的主要指标含义如下：IOPS：指Input/Output Operations per Second，即每秒能处理的I/O个数，用于表示块存储处理读写（输出/输入）的...

使用CPU热点诊断CPU消耗高的问题

ARMS CPU热点作为一种监控诊断工具，通过持续剖析技术定时采集正在执行CPU线程的方法栈快照，定位CPU使用率高的根因。当系统CPU使用率较高时，ARMS CPU热点可为您快速定位导致CPU消耗高的相关业务逻辑方法栈。重要开启该功能会增加约5%...

版本说明

本文为您介绍云监控插件的版本发布信息。4.0.0.1 分类说明发布时间 2025-10-17 新特性 GPU：适配：nvidia在580+时，power_draw改为了instant_power_draw，导致该指标无数据。Plugable上线。允许任务在独立的进程中运行，以提升插件整体...