运维前线:一线运维专家的运维方法、技巧与实践1.8 运维自动化依赖的团队模型

简介:

1.8 运维自动化依赖的团队模型


下面将从能力模型、驱动模型和技能模型三个角度来阐述运维团队和个人的能力要求,最后给出一个参考的组织结构。

1.8.1 团队的能力模型

具体的团队能力模型示意图如图1-15所示。

 

图1-15 团队能力模型

对于我带过的应用运维团队,我都会从如上三个方面对组员提出运维能力要求。

1)业务运维。因为对这块能力的要求越来越低,因此其在我们的考核体系中所占的比重也越来越低。日常的变更、扩容、故障定位、运维规划对人的能力要求都非常低,这些工作都能模式化且平台化,从而减少了对人的倚重。

2)运维研发。我希望每一个应用运维人员都有运维研发的能力,但这在现实中是不可能的。对于应用运维团队和运维部门来说,运维研发的配备必不可少。在应用运维团队的内部,可以让有研发能力的人迅速承担面向业务运维平台的建设,或者参与到部门的运维系统建设中,可以抽出50%的时间参与研发。运维研发能力是能够让团队价值迅速达成的有效保证,没有研发能力的运维不能成为一个好运维。

3)技术研究。运维是一个技术团队,需要通过技术来体现价值,当找到好的技术时就要想着如何将技术应用到业务上,为用户带来价值,比如说提升用户体验,减少成本等。

这个时候就会产生一个问题,应用运维团队内的人也会运维研发,同时又有专职的运维研发团队,那么他们的职责分工如何解决,在工作上是否会存在重复建设?我的回答是这样的:

首先,可以把运维研发初期定位在公共服务平台的研发上,比如说DNS、LVS、配置管理、监控系统、CMDB、数据分析平台等。

其次,运维研发还需要制定相应的运维研发规范,代码规范、UI规范、测试规范等,让所有参与运维研发的人统一遵守,包括应用运维研发的组员。

最后来说一下应用运维小组内的研发能力该如何发挥的问题。其实在很多运维团队中,运维都是跟随业务的,一则可以让应用运维研发人员开发面向业务的运维系统,因为他们最了解该业务的需求,能够实现自己想要的;另外一种更好的操作方式,是让应用运维小组内的研发人员抽出50%的时间参与到以运维研发牵头成立的虚拟研发小组中。一则可以进一步提高应用运维的研发水平;另外还可以提高运维研发对业务运维的理解,同时还能提高带队作战的能力。

那么,运维研发和应用运维的比例应该设置成多少比较合适?我个人认为3:1比较合适,大家也可以自检一下,自己的运维团队到底设置了多少运维研发人员?另外想要检测运维研发配备是否足够,可以周期性地看看运维团队取得的进步,特别是效率和质量等维度。

一个高性能的运维团队一定是以应用运维和运维研发为核心构建的!

1.8.2 团队的驱动模型

具体的团队驱动模型如图1-16所示。

 

图1-16 团队驱动模型

团队的驱动力不同,带来结果的就会完全不同。为什么很多运维人员都说自己很辛苦?这时你可以思考一下到底是什么在引导着你进行运维工作?传统的维护,往往都集中在第一阶段和第二阶段,而进入到高阶运维体系之后,我们需要迅速切换到价值驱动和用户驱动的维度上来。有了用户驱动和价值驱动,对运维的效率和质量就都会有更高的要求,对于外部驱动我们必须走自动化和平台这条道路。建议大家在平时的工作中加入质量、效率、成本等一些KPI要求,不要只局限于自己所做的事情,而是要关注自己所做的事情对产品和用户的影响。

1.8.3 团队的技能模型

BAT(百度、阿里、腾讯)很早就实施了职业通道体系,在运维侧细分了多个能力通道,比如说网络运维、业务运维、运维研发、DBA等。对于运维人员的成长也有明确的要求和衡量体系,在此我就不详细介绍了。

1.8.4 参考的运维团队组织结构

我们不一定要按照这个结构明确设置运维小组,但是运维的职能差不多就是这样。我还有另外一个建议,最好将公共服务研发团队和运维团队放在一个组织结构下,这样将会有利于公共化服务的推广,而公共化服务对运维效率的影响是最大的,如图1-17所示。

 

图1-17 运维团队组织结构

至此,自动化平台的深度解码已经完成。本章从多个层面带领大家了解运维自动化,其实还是希望能给大家带来一点借鉴意义。大胆地往前走吧,一切都有可能,唯独那些实现不了的,都是我们人的问题,无它。

相关文章
|
12天前
|
运维 Kubernetes 监控
构建高效自动化运维系统:基于容器技术的策略与实践
【4月更文挑战第19天】随着云计算和微服务架构的兴起,传统的运维模式正逐渐向自动化、智能化转型。本文将探讨如何利用容器技术构建一个高效、可靠的自动化运维系统,涵盖系统设计原则、关键技术选型以及实践经验分享。通过引入容器技术,我们可以实现应用的快速部署、弹性伸缩和故障自愈,从而提高运维效率,降低系统维护成本。
|
1天前
|
人工智能 运维 监控
构建高效自动化运维体系:DevOps与AI的融合实践
【4月更文挑战第30天】 在当今快速迭代的软件开发环境中,高效的自动化运维体系成为确保交付速度和服务质量的关键。本文探讨了如何通过整合DevOps理念和人工智能(AI)技术来构建一个更加智能、高效的运维体系。文章将详细阐述自动化运维的核心组件,以及如何利用AI技术优化这些组件的性能和决策过程。通过实际案例分析,本文展示了这种融合实践在提高运维效率、降低错误率以及提升系统稳定性方面的显著成效。
|
1天前
|
运维 监控 安全
构建高效自动化运维系统:策略与实践
【4月更文挑战第29天】 在信息技术日新月异的今天,高效的运维管理已成为企业保持竞争力的关键因素。本文将探讨如何构建一个能够适应快速变化需求的自动化运维系统。通过深入分析自动化工具的选择、配置管理的最佳实践以及持续集成和部署的策略,我们旨在为读者提供一个清晰的框架来优化他们的运维流程。文章的核心在于提出一种结合了最新技术和思维模式的综合解决方案,以实现运维工作的最优化。
|
2天前
|
机器学习/深度学习 人工智能 运维
构建高效自动化运维系统的策略与实践
【4月更文挑战第29天】 在数字化转型的浪潮中,企业IT基础设施变得日益复杂多变。传统的手动运维方式已无法满足快速响应和高效率的需求。本文将探讨如何通过一系列策略和技术手段构建一个高效的自动化运维系统。首先,分析当前自动化运维的必要性及其带来的益处;接着,详细阐述自动化运维的核心组件、工具选择以及实施步骤;最后,通过案例分析展示自动化运维在实际环境中的应用效果,并讨论面临的挑战及未来发展趋势。
|
4天前
|
jenkins 测试技术 持续交付
深入探索软件测试中的持续集成与自动化测试实践
【4月更文挑战第27天】 在当今软件开发的快速迭代过程中,持续集成(CI)和自动化测试已成为确保代码质量和加快交付速度的关键因素。本文将探讨如何通过实施持续集成流程,并结合自动化测试策略来优化软件测试工作。我们将分析持续集成的原理、自动化测试的最佳实践以及如何将这些方法应用于实际项目中,旨在为读者提供一套完整的解决方案,以提高软件项目的效率和质量。
11 3
|
4天前
|
Web App开发 IDE 测试技术
深入理解自动化测试框架Selenium的设计与实践
【4月更文挑战第27天】在软件开发周期中,确保代码质量和功能正确性至关重要。随着敏捷开发的普及和持续集成/持续部署(CI/CD)的实践,自动化测试已成为现代开发工作流程的核心部分。本文将探讨一个广泛使用的开源自动化测试工具——Selenium,并剖析其设计原理、架构以及在实际中的应用。我们将通过具体案例分析,展示如何有效利用Selenium进行跨浏览器测试,并讨论在真实环境中可能遇到的挑战及解决方案。
|
6天前
|
运维 监控 安全
构建高效自动化运维体系:策略与实践
【4月更文挑战第25天】在数字化转型的浪潮中,企业IT基础设施日趋复杂多变,传统的手动运维模式已难以满足快速响应和高效管理的需求。本文探讨了构建一个高效自动化运维体系的关键环节,并结合实际案例分析,提出了一系列切实可行的策略与实践方法。文章着重分析了自动化工具选择、流程设计优化以及持续监控的重要性,并讨论了如何通过这些手段降低运维成本,提升系统稳定性和安全性。
|
6天前
|
运维 Prometheus 监控
构建高效自动化运维系统:策略与实践
【4月更文挑战第24天】 在当今快速发展的信息技术时代,自动化运维已经成为提高企业IT效率、确保系统稳定性和敏捷响应市场变化的关键。本文将探讨构建一个高效自动化运维系统的关键环节,包括基础设施即代码(IaC)的实现、持续集成与持续部署(CI/CD)流程的优化以及监控和日志分析的重要性。通过这些技术的融合,我们旨在提供一个可行的蓝图,以帮助企业实现运维工作的自动化,从而提升整体业务效能。
|
15天前
|
敏捷开发 监控 前端开发
深入理解自动化测试框架Selenium的架构与实践
【4月更文挑战第16天】 在现代软件开发过程中,自动化测试已成为确保产品质量和加快迭代速度的关键手段。Selenium作为一种广泛使用的自动化测试工具,其开源、跨平台的特性使得它成为业界的首选之一。本文旨在剖析Selenium的核心架构,并结合实际案例探讨其在复杂Web应用测试中的高效实践方法。通过详细解读Selenium组件间的交互机制以及如何优化测试脚本,我们希望为读者提供深入理解Selenium并有效运用于日常测试工作的参考。
|
15天前
|
自然语言处理 测试技术 API
深入理解自动化测试框架Selenium的设计理念与实践
【4月更文挑战第15天】 在现代软件开发过程中,自动化测试已成为确保产品质量和加速迭代的关键手段。Selenium作为一种广泛使用的自动化测试框架,提供了对多种浏览器和平台的支持,极大地促进了Web应用的功能测试。本文旨在剖析Selenium的核心设计理念,探讨其在实际项目中的应用,并指出常见的误区及最佳实践,以期帮助测试工程师更高效地利用Selenium进行测试工作。