如何避免数据中心闲置服务器泛滥成灾

简介:

摘要:在数据中心,有三分之一的服务器并未投入实际的生产运营。本文中,我们将为大家分析这个问题存在的原因,以及如何解决。相信在看到本文之前,您或多或少的读过关于在现如今的数据中心存在并未执行任何工作的闲置服务器的报道。而根据一份来自斯坦福大学Jonathan Koomey教授与咨询公司Athensis集团的一名合伙人Jon Taylor的联合研究发现,数据中心有高达30%的物理服务器是闲置没有执行任何工作处理的状态,而却很少有人注意到这一点。

相信在看到本文之前,您或多或少的读过关于在现如今的数据中心存在并未执行任何工作的闲置服务器的报道。而根据一份来自斯坦福大学Jonathan Koomey教授与咨询公司Athensis集团的一名合伙人Jon Taylor的联合研究发现,数据中心有高达30%的物理服务器是闲置没有执行任何工作处理的状态,而却很少有人注意到这一点。

这其实并不是什么新的发现;该问题已经存在好几年了。早在2008年,麦肯锡公司就发布过类似的研究报告,发现在数据中心有高达30%的服务器“在功能上已经死了”。而数据中心设施咨询机构Uptime Institute也于2012年发表了类似的报告,发现约30%的服务器被闲置,没有工作。

那么,为什么这个问题会持续存在而未得到解决呢?原因有两个:企业的IT部门不对企业高昂的电费账单责任;服务器一旦部署完成,IT部门对其后续的所有权追踪工作就开始变得糟糕。他们只负责采购服务器,但不用付电费账单或保持适当的库存,使得僵尸服务器不断增加。

“这属于一个管理案例,是对管理的挑战,以及缺乏激励机制所造成的问题。在很多情况下,IT工作人员就能够让事情运转变得正常,并且让企业不必支付额外的电费账单。但他们没有足够的动力去帮助企业降低电费账单。”Taylor说。

TSO Logic公司的首席执行官亚伦·拉罗也发表了自己的观点,认为这是一个管理问题。“我们已经建立了自己的数据中心,并需要其帮助我们每一项业务的运行。当考虑业务优先级时,我认为很多高管都把他们的数据中心的处理看作是一个他们自己无法做任何事情的过程,让数据中心的处理工作在他们看来变成了一种消费。”他说。

“一名首席执行官可以告诉您,他们在劳动力上、在营销上、在销售上到底花多少钱,但一旦涉及到数据中心,这往往是企业最大的开销,他们却没有任何头绪了。”他补充说。

这是怎么发生的?

如果上述这个消息让您吃惊,那就太不应该了。想想看。如果您曾经走进到一处数据中心,您有没有停下来想要知道,机架中的服务器是否都被充分使用了呢?

“没有人去探究,这并不容易寻找。目前还没有简单的方法来找出答案。而如果不清楚相关服务器的所有权的话,IT部门倾向于不去关掉它。” Taylor说。他还补充说,由于达不到理想的保存记录,有时只有关闭某台服务器,看看哪个部门出问题并发出抱怨了,才能够找出谁拥有该服务器的所有权。

惠普技术服务副总裁Alastair Winner表示说,通常有多种方式导致服务器被人们遗忘。

“实际上,对于大多数企业来说,他们自己并不自行编写他们的应用程序,他们的诸多应用程序的大量工作负载需要不同的服务器和解决方案。因此,无疑将存在大量低效的内置系统。”他说。

例如,有些公司故意配置过剩产能,并让系统随时准备好当有超过平时所需的较大的载荷能力时进行接管。因此,他们可能会为需求高峰进行过度配置。

然后还有影子IT,这是某些部门的员工为了方便自己的工作而自行带入企业的IT并没有获得企业官方正式政策许可;某些部门不利用企业正式的渠道,自行采购自己的机器设备。再有就是通过企业的兼并和收购活动,其中的某些冗余系统可能会被搁置,但实际上没有被关闭。

Centrilogic公司是一家云服务供应商,同时也提供云迁移服务。该公司的技术服务主管约翰·阿伯特正在部署Windows Server 2003的迁移。他表示,在他的客户中,大约75%的客户有未使用的闲置服务器。而这还是对大型数据中心而言,更多的情况则是好多闲置的服务器人们根本不知道。

“我们发现,这些情况大多数是一台服务器原本已经设置好了之后,应用程序的所有者改变了他们的想法或应用程序从未得到批准或其只是概念服务器,从未执行任何工作。”他说。

根据他的经验,僵尸服务器往往最常见的是老旧的设备,因为使用该服务器的人员已经转移到采用别的方式,但服务器却从未被改变用途或淘汰而造成的。

“随着时间的推移,您会发现原本了解工作环境变化的相关人员已经调离,但这些环境背景信息却并未被很好的转移给新接手者,因此没有人知道这些服务器,新接手者也不会去碰它们。他们会认为,如果这些服务器存在,那么肯定是在生产环境中运行着的,因此并不用做什么改变。”他说。

帮助清除僵尸服务器的最大动力来源于今年七月微软对于Windows Server 2003技术支持的结束,迫使企业用户必须针对其老旧的操作系统进行迁移或关闭。大多数企业利用对于Server 2003的最后的支持作为一个整理他们完整的僵尸服务器清单,并完全根除僵尸服务器的机会。

“Windows Server 2003项目使得许多企业拉长了对于其僵尸服务器清除的脚步,因为这些企业用户希望能够在其技术支持结束时才来分析盘点他们目前的服务器库存。”阿伯特说。“Server 2003帮助企业用户揭露了他们真实的僵尸服务器,因为否则没有人会看他们。而如果他们不被发现,就没有人会去解决这些问题。”

如何防范该问题

Winner表示说,企业的IT部门需要开始对自己企业所拥有的相关服务器设备进行更好的追踪了。“这是最为关键的,而我们解决这个问题的方式,便是通过真正采取一套经过了非常深思熟虑的资产管理的办法,着眼于掌握服务器的物理位置,并了解他们运作的环境。”他说。

该解决方案的另一部分是捋清所有权。采购服务器或机架的关键标准的一部分应当是总拥有成本,其包括设备的电力和冷却要求。当IT部门需要对企业的电费账单负责时,他们会对让所有服务器保持在最高效率运行变得更加激进。

阿伯特的观点与上述观点有些类似,即数据中心运营商需要保持一个良好的设备库存。“他们需要对于相关的变更控制和文档处理更严格,这样才能让他们在采购一台新的服务器时,能够保持对于相关资产的追踪。之后的相关处置工作将由他们来决定。他们需要更严格的设备追踪,并进行详细的文件记录。”他说。

资产管理需要成为管理工作的重中之重,并须提请到企业管理层和财务总监,Taylor说。“这将会是企业财务总监喜欢的事情。如果您找到财务总监告诉他,可以帮助企业降低经营成本,您认为他们会听吗?当然在这一过程中您需要有相关的信息来支撑您的理论。”他说。

拉罗说,企业的数据中心必须被视为一家公司的供应链的一部分,因此企业必须与关注供应链上的其他部分一样,对其保持高度关注。“沃尔玛就着眼于其供应链的各个环节。其所有的管理人员都集中于关注及时的提供产品,并降低成本。而如果我们开始将数据中心视为企业供应链的一部分,那么相应的变化就将要来。”他说。

本文转自d1net(转载)

相关文章
|
1月前
|
安全 Java 数据中心
Confluence 数据中心和服务器中的严重漏洞 CVE-2023-22515
Confluence 的开发者 Atlassian 已承认此漏洞,并将其归类为损坏的访问控制问题。他们强调需要立即采取行动,并建议用户升级到最新版本以保护他们的系统。Atlassian 将该漏洞的严重级别评定为 Critical CVSS 10。
19 0
|
机器学习/深度学习 网络安全 异构计算
教你如何用家里闲置的Windows电脑搭建GPU服务器炼丹
教你如何用家里闲置的Windows电脑搭建GPU服务器炼丹
1177 0
教你如何用家里闲置的Windows电脑搭建GPU服务器炼丹
|
存储 安全 中间件
数据中心厂商超云加入龙蜥社区,多款服务器完成与龙蜥操作系统适配
欢迎超云加入龙蜥社区,未来将在市场活动、产品兼容认证、行业解决方案等方面合作。
数据中心厂商超云加入龙蜥社区,多款服务器完成与龙蜥操作系统适配
|
弹性计算 数据中心 RDMA
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS自制脑图
70 0
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS
|
Rust 安全 网络安全
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
数据中心失火,360 万个网站被迫下线,一些企业甚至还没有灾难恢复计划,这是被一锅端了?
175 0
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
|
云计算 数据中心 芯片
|
29天前
|
Ubuntu JavaScript 关系型数据库
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
在阿里云Ubuntu 20.04服务器上部署Ghost博客的步骤包括创建新用户、安装Nginx、MySQL和Node.js 18.x。首先,通过`adduser`命令创建非root用户,然后安装Nginx和MySQL。接着,设置Node.js环境,下载Nodesource GPG密钥并安装Node.js 18.x。之后,使用`npm`安装Ghost-CLI,创建Ghost安装目录并进行安装。配置过程中需提供博客URL、数据库连接信息等。最后,测试访问前台首页和后台管理页面。确保DNS设置正确,并根据提示完成Ghost博客的配置。
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
|
1月前
|
存储 弹性计算 数据可视化
要将ECS中的文件直接传输到阿里云网盘与相册(
【2月更文挑战第31天】要将ECS中的文件直接传输到阿里云网盘与相册(
415 4
|
1月前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
18天前
|
弹性计算
阿里云ECS使用体验
在申请高校学生免费体验阿里云ECS云服务器后的一些使用体验和感受。