说明 如果您需要获取云服务器ECS操作系统的监控指标,则必须安装云监控插件。具体操作,请参见 安装和卸载云监控插件。故障列表 您可以查看目标应用分组内当前正在报警的所有资源,方便您快速总览全部不健康实例,及时处理故障。说明 同...
告警中心是系统中用于集中管理和展示各类告警信息的模块。它通过实时监控系统的运行状态、性能指标、异常事件等,及时发现并通知相关人员潜在的问题或风险。
由于不同的监控系统可能会产生不同的告警信息,这些信息可能会分散在各个系统中,导致企业很难全面了解其IT系统的告警状况。这使得响应告警变得更加困难,同时也增加了人工管理的复杂性和工作量。为了解决这些问题,企业需要一种更加统一和...
它通过实时监控系统的运行状态、性能指标、异常事件等,及时发现并通知相关人员潜在的问题或风险。查看步骤:登录 云监控2.0控制台,选择目标工作空间,在左侧导航栏的常驻应用选择 告警中心。事件中心 通过阿里云事件中心,您可以实现从...
本文以Python SDK为例,为您介绍如何通过OpenAPI调用DescribeMetricList接口查询云产品的监控数据。步骤一:查看OpenAPI文档 通过阅读 API概览 得知,查询云产品监控数据的OpenAPI为 DescribeMetricList。请您根据文档,了解调用该接口需要...
云监控插件可以采集主机操作系统的监控数据,对主机监控有重要价值。云监控插件将不断升级版本,以便给您带来更好的监控体验。升级原因 云监控插件版本的升级原因如下:云监控插件会一直迭代新版本,从而增加新特性、修复稳定性问题和优化...
云监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 语言 版本号 说明 参考文档 C++(推荐)3.X 最新版本,推荐使用。安装和卸载云监控插件 Go 2.X 推荐使用C++版本,Go版本插件不再维护。云监控Go...
云监控插件用于采集主机操作系统的监控指标数据,并将数据上传至云监控进行统计分析。可以通过可视化图表查看主机状态,并为关键指标设置报警规则,以便及时发现和处理问题。本文详细介绍如何为主机安装、管理和卸载云监控插件。重要 云...
监控指标成员需要以$开头,在报警规则表达式中的访问方式是@指标[聚合周期].$指标成员,例如:云服务器ECS的监控指标CPUUtilization的Statistics为Average、Minimum和Maximum,监控指标CPUUtilization的平均值的报警规则表达式为@...
提供完善的上下游监控数据 为了实现一个系统级的、全面的可观测性,单一实体监控是不够的,需要整合不同维度的监控数据并构建全链路观测,确保监控系统能够反映出整个应用和服务生态的健康和性能。涵盖从底层硬件到应用层再到外部服务...
提供完善的上下游监控数据 为了实现一个系统级的、全面的可观测性,单一实体监控是不够的,需要整合不同维度的监控数据并构建全链路观测,确保监控系统能够反映出整个应用和服务生态的健康和性能。涵盖从底层硬件到应用层再到外部服务...
阿里云 可观测监控 Prometheus 版 全面对接开源 Prometheus 生态,支持类型丰富的组件...Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息,请参见 Prometheus官方文档。
为什么选择 可观测监控 Prometheus 版 阿里云提供的 可观测监控 Prometheus 版,完全兼容开源 Promethues 协议和查询语法,是基于云上提供的 Prometheus 服务,可以帮助客户构建开放和稳定的统一监控系统。一、数据采集 阿里云 可观测监控 ...
为什么选择 可观测监控 Prometheus 版 阿里云提供的 可观测监控 Prometheus 版,完全兼容开源 Promethues 协议和查询语法,是基于云上提供的 Prometheus 服务,可以帮助客户构建开放和稳定的统一监控系统。一、数据采集 阿里云 可观测监控 ...
为什么选择 可观测监控 Prometheus 版 阿里云提供的 可观测监控 Prometheus 版,完全兼容开源 Promethues 协议和查询语法,是基于云上提供的 Prometheus 服务,可以帮助客户构建开放和稳定的统一监控系统。一、数据采集 阿里云 可观测监控 ...
监控项 您设置或系统默认的监控数据类型。例如:云服务器ECS的CPU使用率、内存使用率、磁盘使用率等。维度 定位监控项位置的维度。例如:云服务器ECS的CPU使用率,通过阿里云账号ID和实例ID两个维度可以定位到该监控项。报警规则 报警规则...
v2.8.7 Prometheus监控 新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用Prometheus监控Windows。请参见 可观测监控 Prometheus 版目前支持的地域。v2.8.7 云拨测 ...
云监控已经发布了新版事件中心,新版事件中心支持更灵活、...相较旧版系统事件规则,新版可以实现更少的规则覆盖更多的系统事件监控场景。因此对于事件订阅场景,更推荐使用事件中心的事件订阅策略,具体操作请参阅 管理事件订阅(推荐)。
使用说明 本文将提供一个示例,创建阿里云产品的数据接入任务 aliyun_task,将云服务器 ECS 的监控项 cpu_total 接入指标仓库 aliyun。返回结果显示,创建数据接入任务成功。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算...
海外地域(Region)上线包年包月计费方式 海外地域(Region)上线包年包月计费方式,可降低出海企业的监控运维成本,使其更有效地利用 可观测监控 Prometheus 版。更多信息,请参见 包年包月概述 请参见 开服地域。2022年08月 功能名称 ...
cpu_total Resources string 是 报警规则作用的自定义监控数据。由自定义监控数据所属应用分组 ID 和监控项所属维度组成。[{"groupId":7378*,"dimension":"instanceId=i-hp3543t5e4sudb3s*"}]ContactGroups string 是 报警联系人组。多个...
功能特性 功能 描述 便捷的插件安装 云监控通过安装在主机上的云监控插件,为您采集丰富的操作系统层面的监控项。更多信息,请参见 安装和卸载云监控插件。丰富的监控项 为您监控CPU、内存、磁盘、网络等监控项,满足主机的基本运维需求。...
您购买和使用云监控支持的阿里云产品后,云监控可以帮助您监控各云产品的...自定义监控 如果云监控提供的监控项不能满足您的需求,您可以根据所需自定义监控项。自定义监控项采集的监控数据上报到云监控,云监控对其提供监控图表和报警功能。
接入外部报警是指外部系统(非云监控)通过云监控的报警渠道进行报警。您可以通过云监控提供的报警服务调用地址,实现该功能。前提条件 请确保您已创建报警联系组。具体操作,请参见 创建报警联系组。操作步骤 登录 云监控控制台。在左侧...
本文描述云监控支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制(RAM)产品提供...
您可以通过云监控统一查询这些云产品的监控数据和系统事件,并为其设置报警。完善的OpenAPI和SDK 云监控为您提供功能完善的OpenAPI和多语言SDK,方便您将监控数据、报警信息等内容与运维平台做集成。数据可视化 云监控通过Dashboard为您...
监控项 单位 MetricName Dimensions(Agent)GPU维度解码器使用率%gpu_decoder_utilization userId、instanceId、gpuId(Agent)GPU维度编码器使用率%gpu_encoder_utilization userId、instanceId、gpuId(Agent)GPU维度GPU温度 ℃ gpu_...
本文为您提供云监控中各阿里云产品的监控指标的使用说明及其索引表。说明 云监控包括基础云监控和企业云监控,关于二者的功能差异,请参见 基础云监控和企业云监控的差异。企业云监控的监控指标名称在基础云监控的监控指标名称的基础上进行...
大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...
关于如何获取云产品的监控项,请参见 云产品监控项。说明 当 指标类型 选择 单指标 时,显示该参数。阈值及报警级别 报警级别和该级别对应的阈值。报警级别对应的报警通知方式如下:紧急(Critical):电话+短信+邮件+WebHook。警告(Warn...
每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...
每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...
实例概览 点击具体的ECS名称可以进入实例概览查看,实例概览为单实例级的可观测,在接入无代理指标(云监控指标)后会展示阿里云服务器ECS实例的基础监控大盘,包括:基础资源消耗监控、系统负载监控、网络基础监控。仅实例为GPU主机,GPU...
为提升云主机监控能力,优化监控数据采集效率,统一 ECS 主机的可观测数据采集,云监控团队将于 2025 年12月4日 起逐步对通过云监控安装的 ECS 主机监控探针进行版本升级,并新增 LoongCollector 采集器 的默认安装功能。此次升级将增强对...
云监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。背景信息 说明 旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您使用...
本文描述Prometheus监控服务支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制...
终端分布 浏览器、设备、操作系统、分辨率都可能会影响前端页面的性能、兼容性及展示问题,因此ARMS前端监控提供这几个维度的均值及样本量情况,让业务方了解到该事件在不同浏览器、设备、操作系统及分辨率上的分布情况。求和统计API 在...
如果暂停应用监控,则系统将无法监控您的应用,请谨慎操作。将配置复制到其他应用 如果您需要为其他应用同步相同配置,可以将对应配置复制到其他应用上。将单个配置复制到其他应用 在对应配置区域单击 保存并批量复制到其他应用。如果弹出 ...
重要 ARMS应用监控面向已开通新版计费的用户提供全新的监控详情页面,新版计费详情,请参见 产品计费(新版)。对于未开通新版计费的用户,如需查看新版监控详情页面,可在 应用列表 页面单击 切换新版。操作步骤 登录 ARMS控制台,在左侧...
提供完善的上下游监控数据 为了实现一个系统级的、全面的可观测性,单一实体监控是不够的,需要整合不同维度的监控数据并构建全链路观测,确保监控系统能够反映出整个应用和服务生态的健康和性能。涵盖从底层硬件到应用层再到外部服务...