重新发现远程管理与监控的价值

2021-11-04 16:35:28

        COVID-19 封锁迫使组织重新考虑他们开展业务和教育的方式,因为他们接受了远程工作工具。工作环境的这种近乎即时的转变给 IT 和数据中心管理人员带来了新的数据中心挑战,因为许多人无法亲自动手进行故障排除。
       由于对物理 IT 基础设施的访问受限,网络管理员比以往任何时候都更倾向于使用远程网络管理和监控工具来帮助重启服务器和其他设备,关闭未使用的网点,这样就不能在不知情的情况下安装新设备,也不能收集一般数据。
       尽管2020年数据中心的规模没有增加太多,Gartner表示,2020年的支出下降了10%,但许多设施确实实现了指数级的服务需求,部分原因是大量远程工作者使用新应用程序。这给IT管理带来了很大的压力,因为许多数据中心在 IT 人员减少和人力资源要求减少的情况下运行,从而限制了人员进入设施。
       国际正常运行时间协会(Uptime Institute)的一项调查强调了这一问题,他们询问了全球200多家关键IT/设施基础设施运营商,“在未来90天内,COVID-19对贵公司的关键IT基础设施运营构成的头号风险是什么?”多达32%的人选择:减少IT基础设施运营人员的级别。
远程管理的价值
       虽然IT和数据中心管理人员在物理上距离其数据中心很远,但他们也转向了电源设备,如直接连接到网络的Switched PDUs,因此他们可以远程管理设备。这些switch pdu提供的一些最有价值的功能是远程命令和控制电源负载的功能,例如:
       远程重启和启动顺序。重新启动并不总是容易的——特别是对于多站点数据中心或托管设施。重新启动可以从web界面远程执行,无需部署服务技术人员。

       电力负载调度。不可否认的事实是,数据中心运行的服务器实际上什么都不做,这是在浪费能源。Switched PDU提供了在每个插座/设备基础上远程管理电源计划的能力。

       锁定可用的插座。有时机架没电或相位需要重新平衡。使用Switched PDU提供了将插座从“断电”模式切换到“通电”状态的能力,这对于管理临界负载和确保正常运行时间非常重要。


环境监测的价值
       不用说,如果您不了解其环境和相关元素,就很难远程管理数据中心。静态且以孤岛模式工作的可视化建模工具与其他关键工具(如数据中心基础设施监控 (DCIM))几乎没有集成。这通常迫使管理人员梳理 CAD 图纸以查明故障设备。然而,在大流行期间,数据中心经理开始更深入地研究设备和工具,这些设备和工具提供了大量的运营可见性。
       在数据中心使用的设备中,环境监测传感器发挥着重要作用。就像众所周知的矿工的金丝雀一样,环境传感器一直在帮助IT和数据中心专业人员监控机柜周围的健康状况,并对可能危及IT资产性能和寿命的潜在问题发出警报。所有类型的数据中心(edge、core和colo)都依赖智能传感器工具,提供对IT设备机架内部和周围环境健康状况的准确洞察。
       如今,大部分 IT 设备都经过优化,可以检测和报告不利的操作条件,因此管理人员可以在代价高昂的问题出现之前迅速采取行动——甚至是在家中远程管理。此外,智能传感器还可以通过以下方式帮助 IT 和数据中心专业人员:
防止过冷、冷却不足、静电放电、腐蚀和短路。

降低运营成本、推迟资本支出、延长正常运行时间并提高未来增长的能力。

提供环境监测并提醒管理人员注意潜在问题,例如存在水、烟雾和打开柜门。

基准温度(也称为设定点)每向上变化度数,最多可节省 4% 的能源成本。

帮助填充 AI、ML 和其他未来计划。

为分布式数据中心运营的多维视图提供有价值的信息。

真正重要的数据馈送仪表板
       大多数数据中心使用某种类型的网络运营中心 (NOC) 仪表板运行,该仪表板可聚合多个来源的信息,但这有时会导致不准确。如果数据不可信,决策就会有缺陷,如果决策有缺陷——需要到机架上验证信息。获取准确的信息不是火箭科学,可以由设备级别的智能传感器和智能 PDU 自动收集,以提供那些值得信赖的环境洞察力。
真正重要的数据将产生可靠的运营洞察力,如果以用户友好的格式显示,管理人员将参与其中。数据中心信息管理 (DCIM) 解决方案通过获取丰富的实时测量数据并将其与详细的资产管理(包括完整的电力链连接可配置性)相结合,提供了轻松的交互。无论是否因为疫情封锁,使用 3D 仪表板,数据中心管理人员可以从远程位置查看其设施的环境条件——比实际在现场要好。

       向DCIM仪表板中提供的聚合数据允许IT和数据中心管理人员查看服务器机架和通往机柜的路径,并可以很容易地深入到单个机柜中,以获得所有计算设备的视图,包括名称、型号和状态。
       但它并不仅仅停留在机架层面,它的可见性延伸到机柜之上,深入到分接箱关键电源监控,可以用作轨道母线槽系统的一部分,也可以作为一个独立的解决方案。在3D仪表板上简单地双击一个关闭框,就会显示出瓦、安培、伏特或千瓦的实时信息。所有这些详细信息都保存在一个模型库中,以消除冗余数据输入,包括:哪些协议在新单元上启用;DCIM集成信息和负载均衡数据。
       从 PDU 获取的远程监控数据使 DCIM 仪表板能够显示电源资源的运行情况以及它们在机架级别的消耗情况。凭借这种洞察力,IT 和数据中心经理可以更好地规划容量变化。此外,通过 PDU 和传感器的数据馈送,他们还可以接收到以下信息:
内阁的温度。

智能机架式pdu或母线槽分接箱电流异常。

湿度的波动。

       一个好的经验法则是始终寻找能够与所有 BMS、DCIM 或其他工具(如 Splunk 或 Tableau)集成的智能 PDU。
结论
       如果说数据中心和IT经理曾经有过拥抱他们的远程管理和监控工具的时候,那就是在大流行开始的时候。即使是现在,疫苗接种正在遏制COVID-19的传播,很大比例的工作人员仍将留在或部分留在偏远地区。在Gartner最近的一项调查中,90%的人力资源主管表示,即使COVID-19疫苗广泛可用,员工也将被允许远程工作,是的,这包括IT专业人士。
       在可预见的未来,数据中心将继续提供高需求的服务。但是,为了满足需求,管理这些关键任务服务的人员还必须使用工具,使日益增长的远程工作人员能够不断监控阈值、预测容量利用率、设置电压陷阱,并平衡数据中心的环境条件。部署智能传感器、传感器管理、PDU、分接箱和DCIM解决方案来实现3D仪表盘,将使远程工作者能够进行他们的工作——通常比走在服务器岛或电源路径上进行实际评估更快。