数字图书馆概况:
传统图书馆作为信息拥有者与提供者的图书文献机构,面临着自动化、数字化、网络化的挑战,需要不断的调整收藏结构和服务方式来适应信息社会的需求。全面实现海量电子图书资料存储、分布式信息存取和共享的数字图书馆应运而生。
数字图书馆是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作的分布式信息系统。它把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便于跨越区域、面向对象的网络查询和传播。它涉及信息资源加工、存储、检索、传输和利用的全过程。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。
数字图书馆建设存储需求分析:
数字图书馆需要大量的磁、光、电等新型存储媒介来存储文本、图像、声音、动画、影视作品等文献信息资源的数字化信息。海量数据信息的存储和管理是数字图书馆的显著特征之一。明确存储需求是规划存储方案的前提,数字图书馆数据信息资源的种类、数量、性质及用户利用的方式、用户的多少等对分析存储系统的容量、性能、传输速度、可靠性等方面的要求起决定性的作用。
数字图书馆具有系统用户数量庞大,并发存取海量数据及业务类型多的特点。如何在复杂、多变的环境中提高基础设施资源的利用率和数据库用户访问效率,确保安全、高效、准确、全面地存取数据,是图书馆存储方案设计考虑的重点因素。
多种数据信息资源对重要性、安全性、再生性、读写性能、更新升级特性及保存时效性等有不同的要求。大文件的连续读写、要求带宽性能高。小文件随机读写,要求处理器的I/O性能,如数字期刊、数字图书等,这里资源访问频率很高,下载流量也比较大,对存储系统的IOPS要求很高。而采用关系型或非关系型数据库形式存储的数据库资源,是基于块级的存储,对这类资源的访问频率很高,需要频繁地传输数据块,因此,也要求存储系统有较高的读写带宽。对于多媒体资源的访问频率虽然不高,但读写数据流量非常大,也需要很好的传输性能。一个数字图书馆的数据信息种类繁多,形式复杂多样,数据的重要性程度不一,数据访问方式各异,因此数据信息的管理难度很高。而数字图书馆的服务是全天候不间断的服务,尤其对那些关键数据的安全稳定性有相当高的要求,因此建立一个满足存储需求、运行稳定可靠的存储系统是数字图书馆建设的基本要求。
浪潮数字图书馆存储解决方案:
本方案中基于浪潮海量存储系统AS10000构建数字图书馆业务系统。保存关键数据的图书馆自动化管理服务器和数据量增长较快的应用服务器,如镜像数据服务器、电子图书服务器、VOD服务器、FTP服务器、资源数据库服务器等将其接入FC-SAN体系,在保证高速I/O通信带宽的前提下由AS10000提供海量的数据存储空间。
浪潮AS10000产品,是国内第一个研制成功的多控制器和全交换体系结构的存储系统,使我国在高端存储领域实现从无到有的零突破,这一创新成果打破了国外厂商长期以来在高端存储系统方面的市场和技术垄断地位。AS10000存储系统采用scale-out横向扩展的存储架构,有效保证了存储系统对于容量、性能的横向扩展需求,其最大容量支持64PB海量存储空间;其海量的存储空间、大规模部署能力,提供了超高的并发访问能力,聚合带宽达到60GB/s、可同时支持6000并发访问,满足数字图书馆的复杂应用需求。
AS10000产品作为一个款高端存储系统,其所支持的应用系统将要求具备更高的数据可靠性、以及存储设备的可用性,必须在存储系统的内部实现更多的可靠性设计。为此研究并实现了部件和交换组件的冗余容错技术,实现了对控制器、磁盘、风扇等物理部件在线维护的支持,采用了多层级的心跳协议、故障监测、故障判断、故障隔离,实现了对多控制器之间服务自动切换的支持,从而在处理和存储的控制器层面保证了系统可靠性、可用性、可扩展性;满足了数字图书馆的可靠性需求。
2013年11月文化部副部长杨志今在“书香中国-阅读引领未来”中国图书馆年会上参观完浪潮参展的AS10000后,对浪潮高端设备的研发实力给予高度评价,同时勉励浪潮在国产信息化道路上继续前行,为文化行业发展做出更多、更突出贡献。