专家博客:针对大型归档的灾难恢复规划(上)

Bill 发表于:11年01月17日 11:53 [编译] 存储在线

  • 分享:
[导读]灾难恢复从广义上来说是经常被存储界讨论的一个话题,不过在这篇文章中,我打算探讨整个市场中的其中一个细分市场:针对大型归档的灾难恢复规划。

本文作者Henry Newman是Instrumental Inc.的首席技术官。他是一位行业咨询师,在高性能计算和存储领域拥有28年的工作经验。 

DOSTOR存储在线1月17国际报道:灾难恢复(DR)从广义上来说是经常被存储界讨论的一个话题,不过在这篇文章中,我打算探讨整个市场中的其中一个细分市场:针对大型归档的灾难恢复规划。

这是关于归档的两篇文章的第一篇文章。下一篇文章将讨论针对大型归档的架构规划。

首先,我对归档的定义是什么?什么是大型归档?归档就是被保存信息的目录,只不过这些信息中的大部分信息的访问频率很低。

归档的定义近来有些变化。就在三四年前,归档的存储介质一直都还是磁带,只配有小型磁盘高速缓存(通常只占总容量的5%以下)。管理磁带和/或磁盘的软件被称为分级存储管理(HSM),而且这种软件是从35年前的大型机上发展而来的。

如今,我们的许多归档已经存储在磁盘上,而且我们在网络上备份数据。例如,我的工作用个人电脑和家用个人电脑都通过互联网进行备份,而基于云的归档如今也很常见。这当然会引发可靠性方面的质疑,不过这又是另一个话题了。

我对大型归档的定义很简单:任何超过2000个SATA磁盘驱动器的归档。现在,这个数量相当于4PB,随着磁盘容量的增长,明年可能将相当于8PB。考虑到2000个驱动器的预期故障率,我将2000个驱动器作为大型归档的大小标准。即使2400个驱动器的RAID-6设置上,鉴于为单个应用程序管理这么多驱动器所需要的重建时间,这也是一个难度很大的系统。

三种灾难类型

我们有三种灾难需要考虑:单个文件或几组文件的故障、元数据损坏以及我经常说的"喷洒器错误"。

计算机室的喷洒器坏掉可能会破坏所有的设备,而单个文件或一组文件的故障与之相比则是完全不同的问题。一个文件或几组文件的故障的发生概率更高,而且比起全面性的灾难(地震、飓风、闪电电击、供电功率骤增、喷洒器坏掉等)更加普遍。不过,当我设计系统架构的时候,我会保证数据随时至少有两个副本。在大型归档中,鉴于重新复制数据所需要的时间以及考虑到灾难发生后存储系统的数据完整性,两个副本可能还不够。

元数据损坏问题的发生概率不高,不过它确实可能发生,而且发生的概率比许多人想象的要高。元数据损坏可能是文件系统元数据的损坏,或者,如果有使用重复数据删除的话,数据块中某个块的损坏(如果没有得到很好的保护将是个灾难)。

当然,在设计数据保护水平的时候,成本是一个很大的因素。许多厂商宣称有99%、99.999%甚至99.999999%的可用性和可靠性。但是,当你需要保存PB级数据的时候,这种可靠性的概念需要重新考虑。

[责任编辑:刘凯]
12月8日,由DOIT传媒主办,以“信息世界 共想明天”为主题的2010年中国存储峰会在北京富力万丽酒店隆重召开,中国存储行业又一次迎来了最具代表性、权威性的年度盛会。
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.