安全看得见,阿里云性能监控 ARMS 全真3D拓扑实现一“屏”了然

简介: 微服务架构下,各类服务之间存在着错综复杂的依赖关系。一旦业务出现问题,追查问题源头就好比大海捞针,没有头绪。但业务不等人,此时,在最短的时间内定位问题根源是开发和运维人员对微服务监控产品的核心诉求。 传统的监控产品提供了表格(table)、表单(form)和仪表盘(dashboard)三种展现形式,因其局限性,并无法完整和直观的提供监控详情,以快速定位问题。

微服务架构下,各类服务之间存在着错综复杂的依赖关系。一旦业务出现问题,追查问题源头就好比大海捞针,没有头绪。但业务不等人,此时,在最短的时间内定位问题根源是开发和运维人员对微服务监控产品的核心诉求。

传统的监控产品提供了表格(table)、表单(form)和仪表盘(dashboard)三种展现形式,因其局限性,并无法完整和直观的提供监控详情,以快速定位问题。阿里云性能监控 ARMS 新推出的全真3D拓扑功能给这个问题带来了完美的解决方案。ARMS 3D拓扑功能,创新地采用三维立体的方式展示系统中真实的架构层级和关系,利用ThreeJS的前端框架建立一个立体的监控空间,让用户一目了然地看到系统的结构与状态。

传统监控方式的不足

在传统的监控产品中,我们最常见的界面就是表格、表单和仪表盘这三种,但这三种界面皆有其局限性。

1541754281092_0d8bfb97_2bfd_4f60_8646_d53ed7dc54c6

  • 表格:通常用于展示大量数据,信息密集,频繁翻页,大部分内容为数值和文字,不够直观。
  • 表单:用于展示某个实例的详细内容,涉及大量文字和图表的阅读。缺点是一次只能聚焦一个实例,如有下层信息,需要跳转到更深层级。
  • 仪表盘:以图表形式对信息的聚合展示,更直观和生动。但一个版面展示信息有限,一般下层信息阅读量就很少。

因为这种界面形式上的限制,我们常常不得不面对让人头昏眼花的大量表格,为了定位一个问题反复跳转,一不留神就迷失在茫茫数据中,想要理解数据之间的关系只能靠经验和记忆。

ARMS的监控创新

ARMS 通过使用全真3D的方式(简称 ARMS 3D拓扑)去展示系统的立体性,帮助用户快速理解和追踪系统节点中的关系。

首先,我们将系统从底到上抽象为 主机-应用-服务 这三个层级,这也是我们在传统监控方式中关注最多的三层信息。在这三个层级上的模块分别代表系统中真实存在的主机(ECS/物理机)- 应用 - 服务。纵向的连线代表主机对应用的支持,以及服务在应用上的归属。

1541754433222_c3182ae6_f915_4847_be6a_08aadc9b6d9b

用户除了可以从全局视角看到自己的整个系统,也可以单独缩放和旋转某一层级,详细查看主机的集群和负载情况,应用之间的调用关系,以及服务的调用量、错误率等。下面我们来一一介绍各层级展示的内容。

应用层

应用层展现内容有四个部分:

  • 中心应用
  • 中心应用依赖的应用
  • 使用中心应用服务的应用
  • 中心应用依赖的中间件

总的来说,就是展示服务自身、服务被谁调用以及服务间的依赖关系。点击应用,会弹出右侧面板,应用的QPS、RT、ERROR的信息都在上面展示。同时,动态的连线关系让我们更清楚地看到应用之间的调用关系,以及中间件组件对系统的支持,甚至底层、主机层每个主机的健康情况。

1541754481064_356b77bd_5cc9_44d8_b529_8aaab4452111

服务层

服务层就是展示各个应用提供的服务详情信息,鼠标滑过就有服务名展示,颜色表示这个服务的响应时长超过阈值(可配置),需要关注。

1541754506790_3ec31bfd_e871_4bcd_bc14_0706f14634f9

主机层

主机层展现的是各个应用的主机详情,点击每个主机可以看到主机的CPU、MEM、Load信息,超过阈值的指标会标记颜色。另外还会展现主机的静态信息,比如主机所隶属的机房、单元、主机名称、JVM、Tomcat版本信息等。

1541754587502_e194b4f4_84a8_4e06_b2ca_b40519909569

以往我们从出错的服务到应用,再定位到具体的机器,可能需要十几次页面跳转,而在 ARMS 3D拓扑 的三维世界中,我们在一个页面中就可以完成这些动作。三维世界的交互方式—拉近、拉远、转换视角和折叠展开,代替了页面的跳转。用户无论拉近到哪个机器或应用,都可以快速的理解自己在系统中所处的位置以及和其他层级的关系,不会因为操作链路过长而迷失自己。

接入方式

当前,ARMS 3D拓扑功能已经上线,用户只要成功接入ARMS的探针,就能以3D的方式去查看自己的系统状态,不需要额外的操作与费用。

1541754664714_9dc9fc48_d2a2_451b_8120_112faf05f844

总结

ARMS 3D拓扑功能提供了一种全新的交互方式,扩充了和应用沟通的维度,实现了360度全方位诊断性能瓶颈和故障节点,以甄别故障出现时,哪些应用和哪些关联的主机出现了问题等,从此,应用离我们如此之近。

欢迎加入Aliware企业级互联网架构钉钉群:21704851

相关文章
|
30天前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
9天前
|
云安全 数据采集 安全
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
阿里云提供两种关键安全产品:Web应用防火墙和云防火墙。Web应用防火墙专注网站安全,防护Web攻击、CC攻击和Bot防御,具备流量管理、大数据防御能力和简易部署。云防火墙是SaaS化的网络边界防护,管理南北向和东西向流量,提供访问控制、入侵防御和流量可视化。两者结合可实现全面的网络和应用安全。
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
|
9天前
|
弹性计算 安全
电子好书发您分享《阿里云第八代企业级ECS实例,为企业提供更安全的云上防护》
阿里云第八代ECS实例,搭载第五代英特尔至强处理器与飞天+CIPU架构,提升企业云服务安全与算力。[阅读详情](https://developer.aliyun.com/ebook/8303/116162?spm=a2c6h.26392459.ebook-detail.5.76bf7e5al1Zn4U) ![image](https://ucc.alicdn.com/pic/developer-ecology/cok6a6su42rzm_f422f7cb775444bbbfc3e61ad86800c2.png)
33 14
|
22天前
|
云安全 编解码
阿里云安全视频审核的最大文件大小为**200MB**。
阿里云安全视频审核的最大文件大小为**200MB**。
13 1
|
1月前
|
云安全 人工智能 安全
|
2月前
|
弹性计算 运维 安全
阿里云轻量应用服务器:一款高效、稳定、安全的云计算服务
阿里云服务器ECS和轻量应用服务器有什么区别?轻量和ECS优缺点对比,云服务器ECS是明星级云产品,适合企业专业级的使用场景,轻量应用服务器是在ECS的基础上推出的轻量级云服务器,适合个人开发者单机应用访问量不高的网站博客、云端学习测试环境等,阿里云服务器网从从使用场景、适用人群、计费方式、系统镜像、网络带宽、运维管理等多方面来详细说下二者区别及如何选择
95 1
|
2月前
|
运维 安全 关系型数据库
数据库自治与安全服务训练营火热开营!完成任务可得国潮保温杯和阿里云定制双肩包!
本训练营带您简单了解数据库自治与云安全服务,数据库自治服务提供云上RDS、PolarDB、NoSQL、ADB等数据库7*24小时异常检测、SQL自优化、安全合规审计、弹性伸缩、数据自治、锁分析等亮点功能。一站式自动化、数字化DAS集成平台,助力您畅享DBA运维智能化。
|
2月前
|
弹性计算 安全 网络安全
带你读《从基础到应用云上安全航行指南》——阿里云产品专家教你如何全方位构建ECS安全体系(1)
带你读《从基础到应用云上安全航行指南》——阿里云产品专家教你如何全方位构建ECS安全体系(1)
427 0