数字档案室基础设施建设丨系统硬件

2023-07-06 15:20:37

        任何一个应用系统的建设、实施都离不开服务器、存储、交换机等系统硬件的支撑,数字档案室也不例外。一般情况下,数字档案室应当在本地配置满足需求的服务器、存储、交换机等系统硬件,不过,在区域性数字档案室应用系统环境中,数字档案室所需要的系统硬件和基础软件等系统资源可以由云计算平台统一提供,建设单位可以因此大大降低数字档案室建设成本和维护管理成本,快速提高建设绩效。


一、服务器


       服务器是数字档案室应配备的主要硬件设备之一。根据架构和性能,服务器可以分为小型机和PC服务器(即x86服务器)等类型。从服务器的外观形式和机箱看,又可分为塔式服务器、机架式服务器和刀片服务器等几类(见图2-2)。



       塔式服务器外形及结构与普通PC机相似,但体积更大,成本比较低,适合入门级和工作组级的服务器应用。塔式服务器主板扩展性强且可用插槽较多,其机箱内部通常预留很多空间,便于硬盘、电源等的冗余扩展,因此,服务器配置可以满足档案类型单一、数据量偏小的单位需求。如果计划将数字档案室服务器放置在档案室,塔式服务器为可选机型。不过,由于塔式服务器机箱大小和外形缺乏标准要求,无法在标准机柜中安装,与机房管理不相适应。


        机架式服务器是实施工业标准化的产物,十分适合电子信息系统机房与设备部署集成管理的要求。机架式服务器与机柜尺寸都按照统一标准设计、生产,能够满足服务器密集部署、整齐摆放、统一管理的需求。机架式服务器宽度为19英寸,高度以U为单位,1U=1.75英寸=44.45毫米,最常用的是1U、2U高度。因此,机架式PC服务器是首选的数字档案室服务器产品。


        刀片服务器是指在标准高度的机架式机箱内插装多个卡式的服务器单元,由于其形似刀片,故称其为刀片服务器。刀片服务器通常应用于大型数据中心,能大大降低场地运行管理费用,节省宝贵空间,具有高处理能力、低耗电和电缆连接点大大减少等诸多优点。是否在数字档案室建设过程中采用刀片服务器,要充分考虑几方面因素。


        第一,配置刀片服务器的初期投资相对较高,后期扩展时卡式服务器单元数量与机箱槽位若不匹配,一部分机箱槽位极有可能长时间空置,且特殊的供电要求将带来前期电源缆线的额外投资;


        第二,如果机箱插满卡式服务器单元,主机房空调系统若无法应对机柜内部的温度变化,容易整机宕机;


        第三,也是最重要的一点,一旦使用刀片服务器,机箱卡式服务器单元的扩展渠道便只有原产生厂商,使用者、供货商都受到钳制,没有选择余地。综合分析数字档案室机房空间、空调等条件以及实际业务需求,在数字档案室建设发展初期,一般不建议采购刀片服务器。


二、存储与备份


        存储与备份设备是保障数字档案资源管理与安全的重要基础设施。数字档案资源的安全保存与高速写入、读出,对存储和备份设备的容量、可靠性、安全性和读取速度有很高要求,应购置扩展性好、性能优异和容错机制可靠的存储、备份设备为数字档案室服务。


1.存储设备


        当前主流的存储设备是各种技术架构的磁盘阵列系统。一般情况下,各单位可采用计算机或服务器硬盘作为数字档案资源的在线存储介质,但如果数字档案资源数量较多,则需选用专门的磁盘阵列对数字档案资源进行存储。


        磁盘阵列是由中央控制器、容错机制和数十块甚至数百块高速、大容量专用硬磁盘等构成的大型磁盘组。磁盘阵列储存数据时,将数据切割成许多区段分别存放在不同硬磁盘上,再通过容错技术( Redundant Arrays of Independent Disks,RAID)以及容错、热备硬磁盘,为存储其中的数据提供最大安全保障。磁盘阵列原理是利用数组方式来作磁盘组,配合数据分散排列的设计提升数据安全性。磁盘阵列通过数据校验提供容错功能,RAID容错建立在每个磁盘驱动器硬件容错功能之上,由此带来更高的安全性。在很多RAID模式中都有较为完备的相互校验/恢复措施,甚至是直接的镜像备份,从而大大提高RAID系统容错度,提高系统稳定冗余性,保证档案数据的高读取速度、高可靠性。


        根据技术架构的不同,磁盘阵列又分为存储区域网络( Storage Area Network,SAN)、网络附加存储( Network Attached Storage,NAS)、直连式存储( Direct- Attached Storage,DAS),其中,SAN又分为 FC SAN和IP SAN。SAN是通过交换机连接磁盘阵列与服务器形成数据存储专用网络的一种技术架构,能够提供高速、高效的存储服务。其中 FC SAN需要采用光纤交换机及相应的光纤线缆等配件,投资较大,而 IP SAN的构建只需采购以太网交换机辅以双绞线等材料即可完成。NAS是一种专用数据存储服务器,即单独作为一个文件服务器直接挂在TCP/IP网络,在授权许可下,允许网络中任一台服务器共享。SAN和NAS还可以作为备份设备纳入数字档案室的整体备份体系之中。DAS是通过与服务器直接连通提供存储服务,可以应用在数据量不大的小规模数字档案室。一般来说,推荐选择SAN或NAS架构的磁盘阵列作为数字档案资源存储设备。


2.备份设备及介质


        除光盘库、磁带库、虚拟磁带库等备份设备外,SAN、NAS等磁盘阵列也可以作为构建异地容灾系统的主选设备,这一点在本书中不作进一步介绍。根据数字档案室建设要求,原则上应结合本单位实际,为数字档案资源备份配备独立的备份设备,初期配置应满足近期工作需求并预留足够扩展空间。


(1)光盘库。光盘刻录设备和光盘库是可用于数字档案资源备份的主要设备之一。一直以来,光盘以其体积小、容量大、可靠性高、不用安装驱动程序、一次写入不可更改等特征被档案行业广泛采用。光盘库既可作为数字档案室应用系统的近线备份设备,也是可靠的离线备份介质。2008年,国家档案局档案科学技术研究所与清华大学光盘国家工程研究中心制定了档案行业标准《电子文件归档光盘技术要求和应用规范》(DA/T38-2008),对档案级光盘(DVD-R)的技术指标、检测和转换标准提出明确要求,具有较强的可操作性。近年来出现的蓝光光盘库容量从10T到100T以上,为数字档案室数字档案资源备份提供了更多选择。


(2)磁带库。磁带备份技术已有数十年历史,技术成熟、可靠,迄今为止仍是数据备份的首选产品之一。磁带库通常与备份软件一同作用,可实现自动化、海量规模化数据备份,可配置全量备份、增量备份等多种备份策略。磁带库通常由磁带机驱动器、磁带存储槽、机械手系统、控制器、机械手、条码扫描系统、磁带入库和磁带出库装置等构成。与磁盘阵列相比,磁带库具有更多的精密机械、电子元器件等,在大容量数据的近线备份、离线备份方面有较明显优势。新一代LTO5、LTO6磁带技术包括一项磁带专有的LTFS文件系统,通过该系统,服务器可直接读取磁带上的数据,甚至能在多个服务器之间共享数据。随着技术进步,可以像使用磁盘一样使用磁带,从磁盘到磁带,还是从磁带到磁盘,都像在Windows里面拖拽文件一样方便。不过,磁带库初次采购成本较高,且完全依赖于备份软件对磁带存储内容进行完整性与可用性检测、校验,备份机制与数据管理存在不够直观的问题。


(3)虚拟磁带库。虚拟磁带库由磁盘阵列硬件设备与备份软件组成,其备份软件功能与管理机制均模拟物理磁带库,即前文述及的磁带库。虚拟磁带库兼有磁盘设备的高性能、易维护和磁带设备成熟的介质管理两方面的优势,适用于数字档案资源的近线备份。虚拟磁带库容量的扩展方法与磁盘阵列相同,但不能如磁带库那样将已经备份数据的磁带取出作离线备份。在一些解决方案中,将虚拟磁带库设在磁盘阵列与磁带库中间作为备份的中间环节或缓冲区,不断将已经传送至磁带库备份的数据删除,增强重要或活跃数据安全性、灵活性,减轻虚拟磁带库的扩容压力。


(4)移动硬盘。顾名思义,移动硬盘( Mobile Hard Disk,MHD)是以硬盘为存储介质,在计算机之间交换大容量数据并强调便携性的存储产品。因为采用硬盘为存储介质,因此,移动硬盘数据读写模式与标准硬盘是相同的。移动硬盘多采用USB、IEEE1394等传输速度较快的接口,能够以较高的速度与系统进行数据传输,可以作为数字档案资源离线备份介质使用,但是,需要按照《硬磁盘驱动器通用规范》(GB/T 12628-2008)等相关标准要求定期加电、检测,发现安全隐患应及时对存储其中的数字档案资源进行迁移处理。


(5)固态硬盘。固态硬盘( Solid State Drives,SSD)是用固态电子存储芯片阵列制成的硬盘,通常由控制单元和存储单元组成。固态硬盘是一种非易失性存储器,读写速度高、功耗较低,其理论读写速度可达750MB/S。固态硬盘没有机械读写装置和磁性,可避免因碰撞、跌落和磁化等原因造成的损坏,具有明显的稳定性。与传统硬盘相比,固态硬盘的价格相对较高,但随着制造工艺的不断提高、成本的降低,固态硬盘的性价比必将进一步提升。


        同传统硬盘相比,固态硬盘仍然存在一些致命弱点。首先,传统硬盘将数据记录在磁层上,理论上可以经受无数次的读写操作而不会有磁失效的危险,而闪存的擦写次数是有限的。其次,固态硬盘的数据被分散存储在各个闪存之中,一旦数据损坏,要从损坏后的闪存芯片中恢复数据几乎是不可能的。因为存储原理不同,在固态硬盘中是一块一块地删除信息或是全部删除,而针对硬磁盘,可以仅删除文件的索引,或是删除一个字母、一个中文字。有关报告中指出,固态硬盘闪存颗粒内部的半导体结构对温度比较敏感,而且,如果固态硬盘长期不通电,闪存内部的晶体管栅极很容易失去其原有特性,导致存储的数据失效。因此,如果选择固态硬盘作为数字档案资源存储、备份介质,必须将其工作环境的温湿度保持在适合范围,且应定期进行检查、检测等管理活动。




三、签名服务器


        在电子档案长期保存期间,使用第三方权威机构颁发的数字证书(CA)或数字时间戳对电子档案作数字签名并生成真实性校验码,用于验证电子档案始终处于原始形态,是保障电子档案真实性、可靠性与完整性的重要措施。实施数字签名有两种方式。第一,仅向CA认证中心注册、采购一个单位数字证书和能够满足应用需求的个人数字证书,即 CA Key,该种方式投资少,适合于规模较小、应用需求较少的情形;第二,对于单位规模较大,且办公自动化系统、数字档案室应用系统应用覆盖到下级机构时,可考虑采购数字签名服务器,建立自有数字签名中心。数字时间戳由国家授时中心颁发,一件电子档案盖一个数字时间戳,作为每件档案真实性的保障。数字时间戳按数量收费,从长期看,其投资大于数字证书方式所需经费。而且,由于数字时间戳应用系统部署于互联网,需要数字档案室应用系统与其实时连接,带来一定的安全隐患。同时,在不同网络中实施数字时间戳,会给操作带来较大不便。