您现在的位置:网站首页 > 科技 > 入门 NAS 掌握这些知识,看这篇就够了

入门 NAS 掌握这些知识,看这篇就够了

时间:2019-11-02 09:47:31 来源:网络整理 作者:刺客 阅读:4946次

nas的核心功能之一是为用户提供存储空间。在存储大量数据的同时,选择快照等方法以确保nas硬盘中的数据安全也非常重要。

因此,除了快照,我们还能为nas中的数据添加额外的保险吗?我将在本文中介绍更多方法。

读取您的硬盘状态

毫无疑问,nas基于硬盘存储数据,硬盘的状态自然与我们的数据安全密切相关。

幸运的是,nas目前使用的大多数硬盘都配备了智能技术——SMART全名自我监控分析和报告技术(Self-Monitoring Analysis and Reporting Technology),用于硬盘自我检查、分析和报告。它通过各种指令测试硬盘内部零件,然后将测试报告与制造商设定的安全值进行比较。

智能信息

一般来说,我们可以通过nas系统(通常位于硬盘/vjbod中的硬盘操作中)或其他智能查看软件(如crystaldiskinfo)直观地查看每个智能数据。通过这些数据,我们可以快速了解每个硬盘的实际状态,以便在必要时提前更换新硬盘,确保数据安全。

换句话说,阅读特殊的智能指令可以帮助我们快速了解磁盘的寿命,提前为“数据危机”做好准备。

关联阅读:你的硬盘如何存储数据?

由于每个硬盘制造商都可以选择向智能数据添加他们独特的属性,所以我无法标记本文中的所有属性,所以本文中列出的大多数智能数据都是通用智能数据,让我们来看看。

重新定位磁场

保存数据时,硬盘实际上将数据存储在磁区中。通过读取磁区中的数据,我们可以快速识别磁区中是否有错误,并修复有错误的磁区。

然而,如果修复磁场的尝试失败,硬盘将被备用磁场替换,即备用磁场将通过映射与坏磁场关联。硬盘写入坏磁场时,会直接跳到映射的备用磁场,以确保数据写入的安全性。这是磁场的重新定位。

这个过程在日常使用中我们完全察觉不到,但是智能数据将被无声地记录下来。该过程中记录的数据主要包括两种类型:

应该注意的是,有固定数量的重新定位区域,每个使用的区域将当前值减少一个。大多数重新定位失败是由硬盘物理损坏或备用区耗尽造成的。

因此,我们应该注意的重点非常明确:以上面提到的crystaldiskinfo为例。通过在crystaldiskinfo主界面中选择相应的硬盘,可以看到智能信息。在这里,我们根据上表找到一行id为05的重新分配扇区,然后我们可以在右边看到它相应的当前值。

对于重新分配扇区计数,当前值表示剩余的重定位数量。当这个值下降到较低水平时,我们应该保留购买新硬盘的预算。如果不可校正的扇区计数增加,也就是说,如果不可校正的扇区计数的原始值不是0,那么应该立即停止该硬盘,应该及时备份数据并用新硬盘替换,以防止数据丢失。

机械硬盘:电机启动重试次数

机械硬盘的处理方法相似,但相关数据不同。在这一部分,我们主要需要注意电机的旋转重试次数。此参数对应于id:10,十六进制值为0x0a。

这是一个仅适用于机械硬盘的参数,表示首次尝试启动主轴电机失败后启动机械硬盘主轴电机所需的尝试次数。也以上表为例,初始值不应高于临界值。因为当主轴电机需要频繁尝试重启时,这也意味着机械硬盘可能已经达到其寿命极限。

终端检查出错

id:184对应的参数和0xb8的十六进制值对应端到端错误,有时也称为纠错次数(error correction times),一般指从硬盘读取数据到内存后数据不匹配的次数。

此错误也与硬盘损坏有关。如果原始值高于临界值,这意味着损坏硬盘的可能性非常高。

已更正和不可更正的数据

这也是一组相应的智能数据。每次我们将数据写入硬盘时,硬盘都会对数据执行额外的计算。这种计算的结果在写入硬盘后称为奇偶校验位。

读取数据时,硬盘会将读取的数据与之前的校验位进行比较,如果完全一致,则通过;如果不一致,校验位用于校正。校正成功后,硬件ecc恢复计数的初始值会增加一个。如果校正失败,则在无法校正的原始错误值上增加一个,并在系统上给出相关提示。

一般来说,校正失败意味着硬盘的硬件有问题,所以报告的不可校正的错误也意味着硬盘的寿命即将结束。

多个硬盘,多层保护

聪明人在阅读了智能信息后可能会这样想:

一个硬盘显然不是很安全,不同硬盘的寿命也不一样,为什么我们不多用几个硬盘来存储数据,以确保数据的安全呢?

独立磁盘冗余阵列,或您经常看到的raid,就是用来做到这一点的。通过将多个硬盘组合到一个或多个阵列组中,raid可以帮助我们的nas提高性能或安全性(当然,两者也可以同时提高),在“数据危机”到来之前为nas添加额外的保护层。

在实际使用中,raid类型被命名为raid plus编号。常见的raid类型包括raid 0、raid 1、raid 5、raid 6、raid 10/01、raid 50和raid 60。每种类型都有其优点和缺点,并且经常困扰一些想加入nas的朋友,所以让我们一起来解决它。

raid 0

Raid 0将两个或多个硬盘组合成一个更大的阵列组。该组合的基本信息如下:

存储数据时,文件被分段(尽可能多的硬盘),然后同时写入每个磁盘,然后在读取时从每个硬盘读取。由于每个硬盘在读写时都会执行相应的操作,因此无论是读写速度,raid 0自然都是raid系统中最快的。

尽管分段带来了速度快的优势,但如果raid 0磁盘中的任何硬盘损坏,存储在raid 0阵列中的数据将丢失该数据段,即整个raid 0中的数据将丢失。

这也是为什么raid 0很少用于存储数据,通常作为只读缓存或临时文件存储位置。

raid 1

Raid 1将两个或多个硬盘组合成一个阵列组,其可用空间由最小硬盘大小决定。使用这种组合,您需要知道的是:

存储数据时,一个文件将同时完全写入阵列组中的所有硬盘,在读取过程中,将分别从每个阵列组中读取一小部分,或者当一个磁盘繁忙时,该文件的这一部分将通过其他磁盘读取。因此,raid 1的写入速度由最慢的硬盘决定,而读取不受最慢硬盘的限制。

Raid 1是交换数据安全容量的典型组合方式。只要整个raid 1组中有一个硬盘处于正常状态,我们的数据就可以正常访问。换句话说,只要整个raid 1组中有两个硬盘处于正常状态,那么我们的数据就处于受保护状态。

因此,raid 1特别适合用户存储一些主要用于只读的重要数据。

raid 5

Raid 5至少需要三个硬盘来构建,但它是一个结合了存储性能、数据安全性和存储成本的存储解决方案。raid 5的基本信息如下:

当存储数据时,数据也被分段(分段的数量比硬盘的数量少1个)并并行随机写入每个磁盘。然后raid 5将通过特殊计算获得额外的校验值,并且该校验值将被存储在不存储该组数据的硬盘中。

这样,在读取期间可以从每个硬盘分别读取raid 5,并且当发生错误时,不存储数据的硬盘中的检查值将用于恢复。

由于raid 5的校验数据需要单独占用一个空间,空间利用率不如raid 0,但由于多个数据对应一个校验值,空间利用率比raid 1好得多。然而,raid 5只能承受一个硬盘的损坏。一旦多个硬盘损坏,存储在整个raid组中的数据将会丢失。

raid 5容量大、空间利用率高、读写速度相对较快,似乎是非常适合日常使用的组织方案,但如果您对数据安全性有很高的要求,那么在恢复数据时具有很大不可靠性的raid 5就不适合您。原因将在后面详细解释。

raid 6

Raid 6至少需要四个硬盘来构建,因为它向raid 5添加了另一组检查数据,所以raid 6更安全,尽管它的空间利用率不如raid 5高。

raid 6的基本信息如下:

当存储数据时,数据也被分段(类似地,分段的数量是硬盘的数量减去2),并且并行地随机写入每个磁盘。通过两种特殊的计算方法获得两个附加的校验值后,这些校验值将被放入两个硬盘,而不存储该数据段。

读取时,文件的每个段分别从每个硬盘读取,当出现错误时,两个硬盘中的检查值用于恢复。

由于raid 6的验证数据需要通过两种完全不同的计算方法获得,并且需要写入两个额外的硬盘,所以向raid 6写入数据的瓶颈不仅是硬盘的速度,而且验证数据的处理器性能(其可能是计算中的处理器或计算中的专用raid卡)也会影响写入性能。当然,正是因为这两组验证数据,raid 6才能同时承受多达2个磁盘的损坏。

Raid 6是一种出色的存储解决方案,兼具数据安全性和存储成本,尤其适用于存储各种重要数据。

raid 10/01

Raid 10和Raid 01是混合raid系统,将Raid 1系统与raid 0系统结合起来,并使用容量来交换高速读写性能和数据安全性。

Raid 10分为两层,至少需要四个硬盘。其基本特征如下:

raid 10的下层由硬盘组成的raid 1系统组组成,而上层使用raid 0系统来链接较低的raid 1系统。写入数据时,数据首先被分段,写入每个raid 1系统,然后存储在每个raid 1的每个硬盘中。

在raid 10中,每个raid 1组可能会损坏到只剩下一个硬盘的程度。此时,整个raid组仍处于可用状态。但是,这次是raid 0。如果一个硬盘再次损坏,整个raid中的数据将会消失。raid 10的数据保护相对可靠。

相比之下,raid 01也分为两层,至少需要四个硬盘。下层是由成组硬盘组成的raid 0系统,而上层使用raid 1系统连接下层raid 0系统。写入数据时,首先复制数据,然后分段写入每个硬盘。

在raid 01中,一旦一个磁盘损坏,整个raid 0组将停止工作,只剩下其他raid 0组可以工作。此外,如果在raid 01系统的raid 1层中只有两组raid 0,那么在一组raid损坏后,剩余一组raid 0数据的风险将非常高。这也是raid 01在实际使用中不太实用的原因。

最后,还附上raid 01的基本信息:

raid 50

Raid 50也是一种混合Raid系统,分为两层,至少需要6个硬盘才能形成。其基本特征如下:

raid 50的最底层是一组由硬盘组成的raid 5系统,而上层使用raid 0系统连接较低的raid 5系统。

写入数据时,首先将数据分段写入每个raid 5系统,然后通过重新分段和验证将数据存储在每个raid 5中。

在raid 50中,每个raid 5组可以随意损坏一个硬盘。此时,整个raid仍处于可用状态。但是,如果同一raid 5组中的两个以上硬盘损坏,整个阵列的数据将丢失。速度比单个raid 5快得多。但是,空间利用率将低于单个raid 5,因为每个raid 5组将使用该raid 5硬盘组的一部分来存储验证数据。

raid 60

Raid 60也是一种混合Raid系统,分为两层,至少需要8个硬盘才能形成。raid 60的基本信息如下:

raid 60的最底层是一组由硬盘组成的raid 6系统,而上层使用raid 0系统连接较低的raid 6系统。写入数据时,首先将数据分段并写入每个raid 6系统,然后使用重新分段和双重检查的方法将数据存储在每个raid 6中。

在raid 60中,每个raid 6组可以随意损坏两个硬盘。此时,整个raid仍处于可用状态。当同一raid 6组中的两个以上硬盘损坏时,整个阵列的数据将丢失。

Raid 60比单个Raid 6快得多,但其空间利用率较低,因为每个raid 6组使用该raid 6组来存储两个额外的检查数据。

为什么我不推荐raid 5

如前所述,raid 5是一种考虑到存储性能、数据安全性和存储成本的存储解决方案,它只需占用最多一个硬盘的卷,就可以轻松完成验证,还可以将其他磁盘空间放在一起使用。同时,从每个硬盘并行读写数据,速度非常快。

但是,随着单个硬盘的容量越来越大,对于只有一个检查数据的raid 5系统,重建过程中出错的概率将越来越大。这是我想在这里解释的主要原因。

在开始之前,我们需要知道从硬盘读取数据时为什么会出现错误:

在硬盘内部,这种错误实际上经常发生。硬盘制造商考虑到了这一点,并将在硬盘的技术细节列表(数据库)中明确给出不可恢复的读取错误率来描述这种可能性。

同时,为了应对ure,机械硬盘的每个扇区后面都有一定的ecc纠错码,用于纠正错误数据(smart中的硬件ecc恢复计数)。当然,ecc不是万能的。一旦存在连续或大量的ecc错误代码,ecc就无法纠正错误数据,也就是说,存在智能报告中无法纠正的错误。此时,我们必须依靠带保护的raid系统来纠正数据。如果没有数据,那么该位置的数据将基本消失。

然而,普通消费级硬盘通常为1e-14/位,而企业级硬盘通常为1e-15/位。当然,这些数据并不意味着只有读取1e+14的概率会遇到ure。遇到紫外线的概率需要用更复杂的公式来计算。由于计算过程非常复杂,这里不再介绍。这里使用的数据都是智湖木龙的计算结果:

由4个1tb硬盘组成的raid 5单磁盘故障后,重建过程中需要读取的数据量为1E-12字节× 8位/字节×4-1 = 24位,而读取24tbit的过程中不存在故障的概率为(1-1E14) 24E12 = 78.68%。

组成4/8 raid 5的不同误码率和不同容量硬盘的重建成功/失败概率如下表所示,这也是智虎木龙的计算结果:

照片:智虎|木龙

可以看出,由1e-14的4 1tb硬盘组成的raid 5重建失败的概率是21.32%,这已经非常高,所以这也是我不推荐raid 5的主要原因。

但是,最后要说的是,ure导致的raid 5重建失败并不意味着所有数据都丢失了,数据基本上还在,只需要其他恢复方法。如果nas的raid卡允许它继续以降级模式运行,最好将所有数据直接复制到另一个阵列。如果raid卡被迫脱机,并且在遭受故障后无法恢复联机,则需要nas售后服务或专业数据恢复。

如果运气好,你碰巧出现在一个没有文件存储的空白区域,那么文件自然就什么都没有了。如果有文件,您就不能恢复一个或多个文件。如果你的运气特别差,在一些特殊的地方出现ure也可能导致文件系统崩溃,最后你只能找到专业的数据恢复。

无论哪种恢复计划,对普通家庭来说都不是一个小的经济负担,最好不要从一开始就使用它。

相比之下,raid 6在恢复时不怕遇到ure,因为如果raid 6损坏了一个硬盘,它只会降级为raid 5。如果损坏两个硬盘,可以通过两组验证数据进行交叉恢复,至少到目前为止,没有必要担心。

如果你真的想使用raid 5,去买一个企业级的机械硬盘,但这也是一笔很大的费用。

备份是保护重要数据的唯一方法

您可能会好奇:在快照技术和raid系统可用之后,nas为什么仍然需要备份?

Raid系统本质上不是备份,它主要起两个作用:第一是保证raid系统处于正常状态时单独写入数据时的性能,并为raid 0以外的系统提供额外的数据保护,例如,处理上述ure情况;第二种是除了raid 0之外的raid系统,它还可以使整个raid系统在恢复硬盘时正常读取、写入和使用。

换句话说,raid在设计之初并不是为了取代备份而设计的。

如果快照在某个时刻处于保存数据的状态,那么备份就是在某个时刻保存数据的副本。虽然快照技术速度快,占用的空间小,但快照只能多次存储在当前硬盘中。如果硬盘损坏,就没有办法恢复。

nas中的备份工具通常通过将数据副本保存到其他硬盘来完成备份过程。因此,当快照由于硬件损坏而无法恢复时,可以通过其他方法进行恢复,这就是备份的含义。nas中的备份系统可以自动执行备份操作、加密文件并将其备份到公共云服务器。它还支持在备份过程中删除重复文件,大大减少了备份过程中的卷。

与其他耗时耗钱的方法相比,备份是“数据危机”后以最低成本恢复数据的唯一方法。

以上是我们如何保护除快照之外的所有数据内容。我希望它能帮助您更深入地了解数据的安全性。