阿里云Kubernetes SpringCloud 实践进行时(6): 熔断器聚合监控

2018-05-25 17:28:39 1730

简介

为了更好地支撑日益增长的庞大业务量,我们常常需要把服务进行整合、拆分,使我们的服务不仅能通过集群部署抵挡流量的冲击,又能根据业务在其上进行灵活的扩展。随着分布式的普及、服务的快速增长与云计算技术的进步,微服务架构也因其特有的优势而备受关注。微服务架构的本质,是把整体的业务拆分成很多有特定明确功能的服务,通过很多分散的小服务之间的配合,去解决更大,更复杂的问题。对被拆分后的服务进行分类和管理,彼此之间使用统一的接口来进行交互。

本系列讲述了在阿里云Kubernetes容器服务基础之上,如何快速搭建基于Spring Cloud的微服务架构中的基础设施:

本文是系列中的最后一篇,着重介绍熔断器聚合监控Hystrix Turbine。

在复杂的分布式系统中,相同服务的节点经常需要部署上百甚至上千个,很多时候,运维人员希望能够把相同服务的节点状态以一个整体集群的形式展现出来,这样可以更好的把握整个系统的状态。 为此,Netflix提供了一个开源项目(Turbine)来提供把多个hystrix.stream的内容聚合为一个数据源供Dashboard展示。

本文章系列中的前一篇已经介绍了单个应用的熔断监控。在实际生产环境中,一个系统往往会包括若干个应用。看单个的Hystrix Dashboard的数据并没有什么多大的价值,要想看这个系统的Hystrix Dashboard数据就需要用到Hystrix Turbine。

Hystrix Turbine将每个服务Hystrix Dashboard数据进行了整合。

下面讲述一下在阿里云Kubernetes容器服务基础之上,如何快速搭建一套熔断器聚合监控Hystrix Turbine。

准备Kubernetes环境

阿里云容器服务Kubernetes 1.9.3目前已经上线,可以通过容器服务管理控制台非常方便地快速创建 Kubernetes 集群。具体过程可以参考创建Kubernetes集群

体验通过应用目录简便部署

点击左侧的应用目录,在右侧选中ack-springcloud-turbine,如下:

图片.png

点击参数, 可以通过修改参数配置进行定制化,如下所示:

turbine:
  appConfig: sampleservice,sampleservice2
  aggregator:
    clusterConfig: default
  clusterNameExpression: new String("default")
  combine-host-port:  true   

eureka:
  client:
    enabled: true
    serviceUrl:
      defaultZone: http://localhost:8761/eureka

其中,

  • turbine.appConfig 配置Eureka中的serviceId列表,表明监控哪些服务;
  • turbine.aggregator.clusterConfig 指定聚合哪些集群,多个使用","分割,默认为default。可使用http://.../turbine.stream?cluster={clusterConfig之一}访问;
  • turbine.clusterNameExpression 参数指定了集群名称为 default,当我们服务数量非常多的时候,可以启动多个 Turbine 服务来构建不同的聚合集群,而该参数可以用来区分这些不同的聚合集群,同时该参数值可以在 Hystrix 仪表盘中用来定位不同的聚合集群,只需要在 Hystrix Stream 的 URL 中通过 cluster 参数来指定;
  • turbine.combine-host-port 参数设置为true,可以让同一主机上的服务通过主机名与端口号的组合来进行区分,默认情况下会以 host 来区分不同的服务,这会使得在本地调试的时候,本机上的不同服务聚合成一个服务来统计;
  • eureka.client.enabled 参数设置为true;
  • eureka.client.serviceUrl.defaultZone 参数设置为Eureka Server的地址;

修改之后,在右侧选择对应的集群、命名空间,指定发布名称,然后点击部署。
几分钟之后,一套熔断器聚合监控Hystrix Turbine实例就可以创建出来。

体验Hystrix Turbine

点击左侧的服务,在右侧点击刚创建的Hystrix Turbine服务提供的访问地址,如下所示:

图片.png

Hystrix的主要作用是会采集每一个HystrixCommand的信息指标,把每一个断路器的信息指标显示的Hystrix仪表盘上。

与访问单个应用的熔断监控Hystrix Dashboard类似,运行Hystrix仪表板需要在spring boot主类上标注@EnableTurbine, 来提供把多个hystrix.stream的内容聚合为一个数据源供Dashboard展示。然后访问/hystrix查看仪表盘,在hystrix客户端应用使用/hystrix.stream监控。

这样能够把相同服务的节点状态以一个整体集群的形式展现出来,可以更好的把握整个系统的状态。

点击服务地址,可以访问到如下的Hystrix Turbine Dashboard,与访问单个应用的熔断监控Hystrix Dashboard界面一样,不同的是输入的是 http://.../turbine.stream?cluster={clusterConfig之一}

图片.png

开发微服务并集成Hystrix Turbine

单个应用的熔断监控在前一篇文章中已经介绍,本节中只会重点关注多应用的聚合。

在使用Spring Boot添加依赖时,需要注意spring-boot-starter-actuator,否则就不能访问hystrix的一些endpoint,如:

  • 提供hystrix 监控界面的http://{ip}:{port}/hystrix
  • 以及返回流式数据的API: http://{ip}:{port}/turbine.stream 等。
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-turbine</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-netflix-turbine</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

发布示例服务,代码具体参阅: https://github.com/AliyunContainerService/spring-cloud-k8s-sample/tree/master/sample-service-hystrix-turbine

对应的Helm Chart代码具体参阅: https://github.com/AliyunContainerService/spring-cloud-k8s-sample/tree/master/helm-sampleservice-hystrixturbine

确保服务项目正常启动之后,在命令行中使用ab多次并发访问: ab -n 10000 -c 10 ....., 如下所示:

图片.png

图片.png

访问http://{ip-address}:{port}/turbine.stream,可以看到如下所示的调用情况:

图片.png

打开Hystrix Dashboad仪表板界面,输入调用服务的地址,如 http://localhost:{port}/turbine.stream,输入Title名称。

随着API服务被调用,仪表板页面会随时刷新熔断情况相关数据,如下所示:

图片.png

这时候,将看到针对服务sampleservice1-hystrixturbine、sampleservice2-hystrixturbine的聚合监控数据。因为这2个服务都有2个对应的实例在运行,所以Hystrix Dashboard中显示的Hosts值为聚合后的值即4。

总结

我们可以利用阿里云Kubernetes容器服务,快速搭建一套分布式弹性服务与容错处理框架Hystrix实例系统,为应用引入和配置Hystrix服务。欢迎大家使用阿里云上的容器服务,快速搭建熔断器聚合监控实例系统Hystrix Turbine,比较简单地集成到自己项目的微服务开发中。

分布式 架构 分布式系统与计算 java docker mysql 数据库 微服务 容器 kubernetes k8s springcloud hystrix 熔断器 turbine

作者

osswangxining
TA的文章

相关文章