我的数据存储和备份

生活在数码的时代,相信每个人都有自己的数据,照片也好,视频也好,都是我们美好的生活回忆。

怎么能安全的保存这些数据?避免因为意外情况导致的数据丢失,是我最近感兴趣和研究的方向。

我的文件

我的数据主要是下面几类,每种类型对数据安全性的要求也不同。

照片和视频

记得 2005 年高二,买了我人生中第一台数码相机,一直到现在电脑里存放了我 20 年所有的码照片和视频。也把我和家人所有的交卷照片扫描成为电子版保存。

有了小孩之后,给小孩拍照和视频的数量在持续增长, 现在有大概 500G 的照片,和将近 700G 的视频。

这部分数据要保证万无一失的存储,不计成本。 毕竟是这么多年来留存的回忆,存储时间至少会大于我的寿命。

收藏的高清电影和音乐

喜欢电影,收集了很多高清电影资源,大概有 7T 左右的电影和电视剧。 使用 AppleTV 在局域网播放, 使用投影仪观看。 也有 200G 左右的 CD 抓轨的音频。

这部分数据是从网络下载的,意外丢失也没太大问题,收集整理还是花了一些功夫的,希望能以低成本的方式保证数据安全。

文档和代码工程

有自己写的一些文档,还有一些自己写的代码工程, 还有一些自己设计的 3D 模型等。

这部分数据也需要万无一失的存储,并且最好能追踪版本变化。

我的存储方式

现在数据主要是存在我的 NAS 系统里。 使用的是 HP Gen8 的 MicroServer。 安装了 Windows Server 2016。

HP Gen8 MicroServer

4 盘位,加了2个 SSD, 共 6 块盘。

分布是:

  • 4T + 4T 组 Raid 1 = 4T,西数红盘 CMR。 用来存储照片,视频和文档。数据同时存2份在2块硬盘,能保证不是2块硬盘同时损坏的情况下,数据不丢失。
  • 4T 单盘 Raid 0 = 4T,西数红盘 CRM。用来存储电影电视剧和音乐,没有备份。组 Raid 0 只是为了用阵列卡可以识别硬盘。
  • 3T 单盘 Raid 0 = 3T,西数红盘,当年从西数出的网络硬盘盒里拆出来的。
  • 256G 单盘 Raid 0 = 256G, 三星 SSD, 用来做系统盘。
  • 256G 单盘, 使用 PCIE 卡转 M.2 接口。 用来做 PT 盘,网传都说 PT/BT 伤硬盘,所以我都是先下载到这块盘,再复制到机械硬盘上,做种也是在这块盘上。

这里另外说一下, 很多 HP Gen8 的配置教程,上来就是禁掉阵列卡,貌似还引起风扇狂转,顶置的这个SATA 接口的盘不能引导系统等问题。这个是不对的, 直接进配置工具配置阵列卡, 单盘也可以做 Raid 0,挂载好之后,使用和普通磁盘是一样的。拿下来的磁盘,通过硬盘盒直接插到电脑上,数据也是可以正常读写的。

其中存储重要数据的2块磁盘,也是 2022 年才更换的新盘,之前是两块 1T 的西数红盘 从 2015 年开始使用,安全服役了 7 年。虽然没有损坏,不过为了数据安全,还是更换了新盘。

为了防止勒索病毒,我所有的盘里的数据,通过 SMB 协议共享出来,都是只读的。其他设备可以读取文件,不能修改。

然后在每个盘建立了一个叫 Upload 的文件夹,这个文件夹其他设备有写权限的。需要将文件存储到 NAS 服务器上, 就先把文件拷贝到 Upload 文件夹,再远程桌面登录 NAS,通过远程桌面移动文件到相应的文件夹,因为在同一个磁盘,文件移动只是修改文件分配表,速度非常快。NAS 这个系统里面,不轻易安装软件,也不执行拷贝到各个盘里的程序。

另外,照片和视频文件,还存储到了阿里网盘中,我在阿里网盘内测的时候, 抢到了 3T 的永久存储空间。

3-2-1 数据备份策略

要想保证你的数据安全,那只有一种办法, 就是备份,备份,备份! 重要的事情说三遍。

只要有足够多的备份,那数据就足够的安全,但同时备份越多,花费的成本就越大,要在成本和安全之间寻求一个平衡。

3-2-1 是一种数据备份策略,让数据可以在数据丢失事件发生后快速得到恢复和还原。

简而言之,我们的数据需要:

  • 三份数据副本
  • 其中两份副本存储在本地的不同介质上,例如一份存储在电脑的内置硬盘上,一份存储在外置硬盘等可移动存储设备上
  • 一份数据副本远程存储在云备份软件等异地解决方案中

实施 3-2-1 备份策略的目的是为了降低“单点故障”可能造成的影响。这意味着,如果一台设备崩溃并清除了一份数据副本,那并不是世界末日,我们手头还有两个选择可以挽救局面!

现在还有更新的说法,叫 3-2-1-1-0 策略,在 3-2-1 策略的基础上,增加了一份离线副本,数据离线了,不能被访问了,就能避免误删除或者病毒等造成的数据丢失。

离线存储探索

按上面说的备份策略,我应该还缺一个离线存储, 所以开始研究离线存储介质:

M-DISC 千年盘

《三体》里面有关于如何让数据保存的时间更长的描述,办法是刻在石头上。

M-DISC

M-DISC 是由 Millenniata 公司在 2009 年发明的一次性写入技术,就是用特殊的高功率激光刻录机,将数据刻录在特殊材料制成的 BD-R 光盘上。和普通的刻录光盘比,专门设计的材料能保存更长的时间,号称能保存 1000 年。

刻录 M-DISC 需要特殊支持的蓝光刻录机,光盘和刻录机的品牌有:铼德、威宝(Verbatim)、清华紫光等。

查了下价格, 在2024年这个时间点, 刻录机大概 RMB 800 元左右。 光盘 RMB 20 元左右一张,25GB 容量。平均 0.8元 / GB。

优点:

  • 只读介质,写入后不能更改。
  • 保存时间长,体积小,对存储要求低。

缺点:

  • 存储容量小,成本高。

LTO 磁带

磁带听上去是个很古老的东西,其实在专业存储领域,磁带一直在发展,经过多年的技术竞争和迭代,最终 LTO (Linear Tape Open) 标准脱颖而出,成为市场的主流。

LTO

从2000开始,经过了多个版本的迭代,已经从 LTO-1 发展到了 LTO-9,单盘磁带的容量也从 LTO-1 的 100GB 发展到 LTO-9 的 18TB。

磁带现在主要用在数据中心,所以价格也贵的离谱,LTO-9 的磁带机价格基本是 RMB 5W 左右, 一盘 LTO-9 的磁带 要 RMB 1000 块左右。

那为啥还要写这一部分呢,因为磁带机的更新换代,我们可以捡垃圾啊。

LTO 迭代的规则是, 每一代磁带机,可以读写本代和上一代的磁带,可以读取上两代的磁带。 也就是说 LTO-6 的磁带机,可以读写 LTO-6 和 LTO-5 的磁带, 可以读取 LTO-4 的磁带。

而某鱼海鲜市场,LTO-6 的二手磁带机大概 1500 元左右。 LTO-6 磁带大概 RMB 80 元左右,2.25 TB,平均 0.0355 元 / GB。而 LTO-5 的磁带大概 RMB 25元左右,1.5TB,折合 0.01667 元 / GB。

优点:

  • 存储容量大,成本低。使用二手磁带成本非常低。
  • 可以增量备份。

缺点:

  • 只能顺序读取,不能随机读取。
  • 备份的流程较复杂。
  • 存储时要避免接触有磁性的物质。

机械硬盘

把接卸硬盘直接拆下来,也能作为离线存储。

WD HD

看了下价格, 西数红盘 4TB 的价格在 800左右, 平均 0.2元 / GB。

再加上硬盘比较脆弱,怕磕碰。

优点:

  • 可以随机读取,读写速度快。

缺点:

  • 比较娇贵,怕磕碰。

总结

存储介质驱动器价格(元)存储器价格(元)存储器容量(GB)平均成本 (元/GB)
M-DISK BD-R80020250.8
磁带 LTO-615008022500.0355
磁带 LTO-58002515000.01667
机械硬盘080040000.2

从数据上看,使用磁带有巨大的成本优势,虽然是二手的设备,如果能买到成色比较好的,寿命还是有保证的。

我的离线存储方案

我最终选择了 LTO-6 的磁带驱动器进行离线存储,型号是 HP LTO Ulitium 6250 磁带机。 磁带主要选择了 LTo-5 的磁带。

因为现在 LTO-5 的磁带相当便宜, 买 LTO-6 的磁带机是因为 LTO-6 的磁带机相较 LTO-5 的价格差距不大,毕竟电子产品买新不买旧。

下面两篇博文详细记录了我折腾 LTO-6 磁带机的详细过程:

songfei 支付宝支付宝
songfei 微信微信
0%