JuncoJet 发表于 2024-6-4 15:51:10

说说12年的NAS怎么修(纯享文字版)

说说12年的NAS怎么修
QNAP TS-419P II

因为磁盘检测,第二块盘出现2500个坏扇,所以硬盘架亮红灯
RAID10 自动降级,在磁盘管理界面可以看到 1- 3-4,这样的数值
2号盘已下线
这些硬盘都已经通电10年之久

按照常规操作,当然是直接更换2号盘,NAS能够自动重建RAID
所以直接换了新的2号盘

这当然还没完
重建RAID经历了一晚上,第二天管理界面显示 3-4
1号盘和2号盘都下线了,RAID不工作了……
第一个想到万能的重启,重启完依然同样的错误

至此RAID10下线了

百度百度百度
网上看到,对于RAID故障,都是需要mdadm命令来操作
但是NAS的mdadm版本很低,整个系统的命令工具,都版本很低
而且命令非常的少

找台老机器,装CentOS6.5系统,升级6.10,更新工具集
安装curlftpfs,screen,pigz等命令
拆硬盘,挂载CentOS上

对4块盘进行 dd 镜像,并用pigz压缩
dd if=/dev/sda bs=4096 conv=noerror,sync|pigc -1c>XXXX.img.gz
基本上每块硬盘都做不完镜像,都有问题
设置了noerror也做不完镜像,只有1块盘能够2T盘可以做到1.8T镜像
做一次镜像需要使用28小时,所以4块盘捣腾了不少时间

尝试了镜像没有结果
然后尝试恢复raid

mdadm -Af /dev/md10 /dev/sd3
能够挂载成功RAID10
大致关系是 13 24 两块盘能够挂载RAID
14 23 这样的关系没法挂载

挂载mount /dev/md10 /mnt/md10
查看文件没问题,文件都在

然后对md10做镜像,也不行,只能做260G左右的镜像
会中断,分段做镜像的话没太大意义,md盘raid后有3.6T的大小

尝试直接拷贝到远程服务器目录上
cp 提示权限问题,rsync 同样有提示权限问题
百度百度百度
发现ext4文件系统有个 noacl 的参数,可以去除掉acl权限
使用上,效果不明显,还是提示权限问题

尝试直接tar打包,可以,没有提示权限问题
tar cvf - /mnt/md10|pigz -1c>md10.tgz
对文件和目录进行多线程tar.gz打包

猜测,可能ftpfs不支持权限,而无法拷贝到远程目录
tar.gz打包的话,可以把权限信息打包进压缩包里,tgz YYDS
经理了一天一夜,有少量报错,压缩包大小3.1T,整个分区磁盘占用3.6T
数据完整性应该是很可靠的

至此,终于完整备份了一遍NAS的所有数据
(已经修了一个星期时间)
可以大胆的干了

把磁盘插回NAS,尝试mdadm -Af强制挂载RAID10
和CentOS上一样操作,但是
parted /dev/md0
:p
Error: partition length of 11711673216 sectors exceeds the               
loop-partition-table-imposed maximum of 3198367612

并不能列出ext4文件系统
这很奇怪,NAS上没有lsblk命令,连parted都不好使
(实际,后面我论证出来,这是NAS上的BUG)

经过不断的尝试,插盘,换盘(新盘,旧盘)
终于,把RAID搞坏了
几块盘的信息都完全不同步了
mdadm -E /dev/sd3

拆除所有的盘,重启NAS
开机出奇的快,但提示,【1.初始化】【2.还原系统】(其实是英文)
两个选项,选项1,提示不会清除数据
选项2,提示会清除数据
我选1试试,提示需要上传固件
选项2,考虑用户配置尚未备份,所以暂时未选

对用户数据备份
/mnt/md9/.config/ 目录下是整个NAS的配置文件(即用户数据)
包含了samba账户,系统账户等,各种数据,非常庞大
tar czvf config.tgz .config/
打包备份整个配置文件

至此底气十足
【2.还原系统】选这个,依旧提示需要固件
看了固件是省不了了

更换3块全新硬盘,123
4盘状态还行,继续使用,毕竟硬盘也要花钱买嘛
1盘会掉盘,2盘2500个坏扇,3盘速度只有几百k
这三块盘全换

进ssh,删除4块盘的分区信息
dd if=/dev/zero of=/dev/sda bs=4096 count=1
dd if=/dev/zero of=/dev/sdb bs=4096 count=1
dd if=/dev/zero of=/dev/sdc bs=4096 count=1
dd if=/dev/zero of=/dev/sdd bs=4096 count=1

在CentOS系统上可以看到,2TB硬盘,是4096字节一个物理扇区,逻辑扇区512字节
NAS上面没有smartctl命令,fdisk也没法列出信息
但按照经验,4096字节清除就行

然后上传固件,重装系统
创建RAID5分区,比原先3.6T多了1-2TB空间,爽了
本身NAS机器很慢,换了新硬盘,速度还有小小的提升

等一切完成,数据回拷
又遇上了新问题

因为NAS上命令有限,所以……
把NAS通过SMB协议挂载到远程服务器(WIN2008)上,rar解压文件,中文名乱码
WIN2008上本机解压也乱码,tar在Linux打包所致,默认编码utf8,windows常用gbk
百度百度百度,无果

把远程服务器(WIN2008)挂载到CentOS服务器上,
把NAS FTP协议挂载到CentOS服务器上,解压文件,无乱码
curlftpfs USR : PWD@192.168.110.234 /mnt/remote/ -o allow_other
解压时提示权限错误,有些gid=0什么的,解压时设置不上
但文件没什么问题,解压速度还行

把NAS SSH协议挂载到CentOS服务器上,解压文件,无乱码
权限无异常,不报任何错误,问题完美解决
但是……
由于SSH协议是加密通讯,所以加解密是考验CPU的
在NAS上,CPU始终占用100%,Load average达到了8

Mem: 494100K used, 21392K free, 539889K shrd, 2328K buff, 184612K cached
Load average: 8.04, 7.40, 6.80    (State: S=sleeping R=running, W=waiting)

PID USER                                 STATUS   RSSPPID %CPU %MEM COMMAND
26470 admin                              R       4116 14855 60.30.7 sshd
3002 admin                              SW         0   2 15.00.0 md0_raid5
26683 admin                              S       1660 264708.20.3 sftp-server

拷贝+解压速度只有2M,带宽都占不满,被CPU给拖累了
好在问题解决,只要不断电断网,解压个几天问题就解决了

ceceky 发表于 2024-6-4 16:07:45

这东西就这样,同批硬盘,其中一个报错,更换一个新的等着重建,但是重建失败的还真不少,应为其他盘也健康堪忧

JuncoJet 发表于 2024-6-4 16:10:20

CentOS 的玩法还是可以的,
ftpfs cifs sshfs 远程的硬盘随便挂载
还有 iptables 能够随意的做 masq ,实现路由,负载均衡等
NAS的命令行功能很鸡肋,性能也低,可玩性几乎0
主要图个简单嘛,但要是坏了,那真要命

C76128 发表于 2024-6-4 17:22:46

我觉得最可靠的就是多盘多重备份,简单粗暴有效果,不用整那些太复杂的

JuncoJet 发表于 2024-6-4 17:24:42

C76128 发表于 2024-6-4 17:22
我觉得最可靠的就是多盘多重备份,简单粗暴有效果,不用整那些太复杂的

这个嘛,怎么说,重要数据都好说,投入多少钱都会去备份
像这种,10年老设备,数据可有可无,有人想找数据那就有用
没人找数据那就没用
不会去投入钱做备份,也不值得

南蛮 发表于 2024-6-4 20:07:34

JuncoJet 发表于 2024-6-4 17:24
这个嘛,怎么说,重要数据都好说,投入多少钱都会去备份
像这种,10年老设备,数据可有可无,有人想找数 ...

用的是软RAID还是硬RAID?总感觉软RAID不是很靠谱,有点怕怕!我的NAS不=没组RAID,专门挂了一款盘做备份,将几个重要的文件夹用同步软件同步到备份盘上备份。

JuncoJet 发表于 2024-6-4 20:11:24

南蛮 发表于 2024-6-4 20:07
用的是软RAID还是硬RAID?总感觉软RAID不是很靠谱,有点怕怕!我的NAS不=没组RAID,专门挂了一款盘做备份 ...

说实话软RAID好恢复些,通用技术
硬RAID LSI的都有版本差异,家里的HP XW8600无法打开,DELL的阵列卡的硬盘
也无法删除掉RAID,同是LSI的硬阵列卡

ding765 发表于 2024-6-5 15:16:18

重要数据还是及时备份,07年去黑网吧搞维修丢了一块移动硬盘里面很多重要数据,发现后回去找已经没有了现在都后悔不已

ding765 发表于 2024-6-5 15:17:46

C76128 发表于 2024-6-4 17:22
我觉得最可靠的就是多盘多重备份,简单粗暴有效果,不用整那些太复杂的

重要数据我现在都是双保险硬盘备一份 蓝光bd备一份

李默 发表于 2024-6-5 23:37:52

10年时间都是7x24运行么?

JuncoJet 发表于 2024-6-6 08:31:32

李默 发表于 2024-6-5 23:37
10年时间都是7x24运行么?

是的      

locky_z 发表于 2024-6-6 08:59:29

组成硬Raid,有时候会被捆绑在一棵树上,对于过保后的维护更麻烦。
例如公司早期的服务器,硬Raid(阵列卡在主板上),坏一个硬盘,重建很慢;还有一次,主板坏了。Raid的硬盘拿到别的机器没法读,只能找服务站买主板,过保后的主板价格那个贵呀。

现在我都直接用windows磁盘管理器的软Raid 功能就算了。至少主板坏了,我的硬盘还能挂到别的电脑上读数据出来。

其次Windows下恢复数据的工具和知识也容易找很多。

JuncoJet 发表于 2024-6-6 09:25:01

locky_z 发表于 2024-6-6 08:59
组成硬Raid,有时候会被捆绑在一棵树上,对于过保后的维护更麻烦。
例如公司早期的服务器,硬Raid(阵列卡 ...

主要硬RAID有版本
不同设备,不兼容,只能去数据恢复中心

李默 发表于 2024-6-7 01:31:05

JuncoJet 发表于 2024-6-6 08:31
是的

你这nas平时读写多么?就你一个人用这nas,还是很多人在用?

JuncoJet 发表于 2024-6-7 08:29:49

李默 发表于 2024-6-7 01:31
你这nas平时读写多么?就你一个人用这nas,还是很多人在用?

公司的
一共6台NAS
这台最老的
页: [1]
查看完整版本: 说说12年的NAS怎么修(纯享文字版)