无人值守的机房动环综合运维解决方案

2024-01-15 16:09:36

无人值守的IDC机房动环综合运维方案


一、 数据中心机房运维痛点


随着“东数西算”工程和新基建的加速落地,数智化技术正逐渐渗透到各领域。但随着数据中心建设规模的逐步扩大,必然带来能耗的大幅增长和机房设备数量的不断扩充,传统机房监控和管理模式已无法满足数据中心“集中监控、统一管理”的需求,运维工作面临大量难题。

数据中心机房内的设备种类繁多,涉及IT、电力、通信、网络、消防、安防等,加上虚拟化云架构的出现和普及,机房的复杂度越来越高,而运维管理的复杂性急剧增加。


数据中心机房内的设备需要长期、不间断、低能耗、安全可靠的运行。一旦发生故障,需要快速定位,及时准确处理,但由于设备故障处理需经过多个环节,需要耗费大量时间,导致故障处理时间较长,影响业务的正常运行。


作为企业的核心资产之一,数据中心机房的重要性毋庸置疑,一旦机房发生灾难,恢复时间相对较长,将对企业正常运营造成较大影响。


数据中心机房设备量大,但实际资源利用率往往不高。例如,有些服务器的CPU利用率、内存利用率和磁盘利用率很低,导致机房的整体资源利用率较低,影响了机房的运行效率。


数据中心机房的检查工作多依靠人工现场检测、纸质记录等方式,智能化程度低,工作繁重,耗时耗力,却依然存在不连续、不及时、遗漏、错漏等问题。


数据中心机房运维工具多样化,人员学习困难,且各工具产生的运维数据格式不统一,导致运维数据利用率低下。


快速变化的IT业务需求导致资产变更成为常态,依靠Excel等工具进行资产管理,无法保障机房的资产信息能够准确及时变更,长时间就会导致,资产数据信息逐渐失真。


二、 泰物动环数据中心机房无人值守方案


一个完善的数据中心机房监控运维系统,应具备五个特点,一是实现从设备运行到机房环境的多层次监控;二是支持设置多种丰富的阈值来监控危机;三是提供丰富的报警方式来确保相关人员能够接收到告警信息;四是提供可视化的自动运维编排方式,实现自动巡检和故障自愈;五是全面兼容国产软硬环境,符合国产信创要求。


机房设备具有数量大、种类多、价值高、使用周期长、使用地点分散、缺少实时性管理、管理难度大等特点。泰物数据中心机房无人值守方案,通过形象化的虚拟场景和真实数据相结合,增强机房设备、设施数据的直观可视性、提高其利用率。

在设备采集层,泰物动环可对动力系统如配电、UPS等,环境系统如温湿度、漏水、新风系统等,安防系统如烟感、视频监控等,以及其他常规网络设备、机柜等进行全面监控。

在集中监控层,平台部署在应用服务器上,负责采集、存储运维数据,并对数据进行分析展示,对异常数据进行告警等。

在智能运维层,以实时监控为基础,结合自动化运维和设备控制,实现对机房的立体管控。提供多种故障预警通知方式,保证用户可以第一时间获取故障信息,进行干预,并对实时、历史的机房数据进行统计分析。

01


数据中心机房3D可视化



2.3D机房可视化管理



以2.5D管理视图对不同品牌、类型、版本的网络设备、安全设备、存储、主机、中间件、数据库、虚拟化、应用服务、视频监控、动力设备、环境设备等进行统一、全方位、多层次的综合管理,实时分析资源当前性能和运行状态,直观反映资源的动态变化对支撑业务的影响。


2.3D机房监控展示系统


通过不同颜色、图标表示被管理对象的状态信息,助力运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。提供便捷的机房综合信息展示方式,可对机房状态、机房设备量、机房设备类型等进行快速查看。


02数据中心资源统一监控


本方案实现数据中心机房中网络设备、动力设备、环境设备、安防设备等的信息高频采集,并结合智能算法,实现对数据中心机房的整体架构、设备运行状态、业务可用状态的实时信息采集和感知。通过对机房中海量设备的智能解析和关联分析,助力运维人员从多个维度实现对相应告警的智能分析,解决传统运维监控中关联数据缺失,辅助排障信息不足的问题。


网络设备监控


方案支持对机房内网络设备,如:交换机、防火墙、路由器、服务器等的性能、故障进行全面监测,屏蔽厂商、型号差异,全面掌握机房整体运行情况和运行效能,能高效、快速、精准进行故障定位诊断。



设备资源可视化显示


动力设备监控


方案实现市电参数监测、UPS参数监测等功能,对机房动力设备进行实时监控、集中管控,全面了解UPS的运行状况,及时地发现并解决UPS运行中出现的各种问题,全面保障机房动力系统安全稳定。


环境设备监控

实现机房烟雾监测、精密空调监测、温湿度监测、漏水监测等功能,并在监控界面上以图形形式直观地表现出来,一旦监测数据超过安全范围,系统第一时间发送报警,为机房打造安全无忧的运维环境。


安防设备监控


实现视频监控抓拍、门禁状态监测等功能,保障机房安全,降低机房安全风险。

本方案可对不同品牌、不同型号的摄像头进行统一运维,融合网络高清、智能分析、多级管控为一体。支持监管视频监控体系涉及的视频前端设备(摄像头、卡口、编解码器),传输设备(光纤收发器、EPON 等)内场设备(网络与安全设备、主机/虚拟机、存储设备)、机房动力环境等多种设备,等统一接入、集中管理。


03无人值守的异常告警


实时故障预警,及时洞察异常信息

通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个机房运维中各种事件信息、设备故障、网络异常、流量异常等告警,全面采集数据中心机房内所有联网设备,如存储、服务器、路由器、交换机、防火墙、虚拟化、云、UPS、烟感、温度、漏水、空调等设备、资源、应用、服务等的状态信息,通过对告警机制以及阈值的设置,第一时间获取准确的告警信息,快速定位告警设备,提升告警处理效率,降低因设备故障带来的损失。



异常事件管理


将事件和告警分离管理,接收设备/服务器主动发送的消息,集中处理后,及时地通知用户,并可以通过集中的管理界面进行管理。接收设备/服务器主动发送的消息,极大地提高了管理的主动性,通过统一界面集中管理事件,降低了管理的难度。



三、 自主研发安全可控 全面适配国产信创环境



信创产业包含了从IT底层的基础软硬件到上层应用软件的全产业链的安全可控,涵盖了应用软件、信息安全、IT基础设置、基础软件四个领域。其中,基础软件是信息系统最核心的部件,是保障信息系统安全的重要阵地和最后一道防线,其创新应用与自主可控关系到国家安全和利益,也是产业自主发展的基础。



本方案支持部署运行在中标麒麟、银河麒麟、红旗Linux等国产操作系统,支持在达梦、金仓、神州等国产数据库进行数据存储,通过东方通等国产中间件提供对外服务,支持龙芯、申威等国产CPU架构,并实现对国产化CPU、服务器、数据库、中间件等IT软硬件设备的综合监控与运维管理。


无人值守的机房动环综合运维解决方案,找山东泰物,4006578880.