V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
a342191555
V2EX  ›  NAS

DS918,遭遇两次 SSD 缓存损毁了

  •  
  •   a342191555 · 2023-02-04 19:15:54 +08:00 · 7571 次点击
    这是一个创建于 440 天前的主题,其中的信息可能已经有所发展或是发生改变。

    DS918 下面有两个 M.2 插槽,本着不浪费插槽的原则,插了两块 HP 250GB 的 EX900 ,做 RAID-1 的 SSD 缓存群组。

    22 年 3 月底,有一天在拷贝大量文件时,NAS 突然发出 哔-哔 的声音,发现提示 SSD 缓存已降级,其中一块盘状态变成了“堪用”。在 PC 上查看 S.M.A.R.T ,没见到明显问题,写入量仅 8T (相当于全盘仅写入 32 次 )。

    那段时间 SSD 降价,于是在京东又买了两块 CUSO 的 500GB 硬盘,把前面两块 SSD 换下来了。刚刚,又是在拷贝大量文件(总大小>100GB )时,又有一块盘被干掉了。。因为 NAS 不在身边,暂时没在 PC 上看 S.M.A.R.T 信息,对于写入量我预测也相当低,因为平时使用非常少。

    哎,头疼…

    51 条回复    2023-03-31 23:01:53 +08:00
    shinession
        1
    shinession  
       2023-02-04 19:25:53 +08:00   ❤️ 1
    N 年前入手过 412 和 914, 西数红盘 2T 4T 8T 的加起来有 8 块, 其中 6 块盘在 3 年内坏掉, 同期的台式机里 2 块西数盘十年都没坏, 后来就没再玩过群晖了, 找了个报废笔记本外挂硬盘盒搞定
    hanssx
        2
    hanssx  
       2023-02-04 19:27:31 +08:00 via iPhone   ❤️ 1
    据说大内存比缓存好用,我使用的 32G 内存,没有缓存版,另外可以尝试只用一块盘做读缓存?
    GrayXu
        3
    GrayXu  
       2023-02-04 19:30:52 +08:00   ❤️ 1
    好奇是完全坏了,还是只是出现掉盘
    documentzhangx66
        4
    documentzhangx66  
       2023-02-04 19:35:48 +08:00   ❤️ 1
    监控磁盘温度,然后再拷贝大量文件试试。
    a342191555
        5
    a342191555  
    OP
       2023-02-04 19:41:30 +08:00
    @shinession #1 啊我里面放的 HDD 也是 WD 的红盘,有点慌

    @hanssx #2 这个 CPU (J3455) 看 ark.intel.com 上写最大 8GB ,但我用的是 8GB x 2 也能识别,没想到 32G 居然也行? 我之前是用一块盘做只读缓存,也的确一直没遇到什么问题。

    @GrayXu #3 不是完全坏,可以理解成掉盘,在 DSM 里能看到那个盘,但它的状态是损毁,即使在 PC 上格式化后再插回去,也依然是损毁,无法被 DSM 使用,但在 PC 上还是能正常用的,读写量较低,但是剩余寿命会掉得比较明显。

    @documentzhangx66 #4 这个缓存已经损毁了,再拷贝就和 SSD 缓存无关,应该也没什么帮助了。刚刚损毁时看了一下温度,基本是室温,十几度。
    Admstor
        6
    Admstor  
       2023-02-04 19:50:02 +08:00   ❤️ 1
    你说的 8T 是 host writes 还是 NAND writes?
    250G 的 TLC,用作缓存的,实际因为 SLC 模拟的关系,写入放大会很多很多
    dingdangnao
        7
    dingdangnao  
       2023-02-04 19:54:12 +08:00 via iPhone   ❤️ 1
    我的 918 有一天早上突然连不上,电源灯一直闪,重置之后一两分钟 就又开始连不上,闪….然后走售后,售后修了半个月 回来了,机器给我磕坏了…..最后退了 85%的款……现在硬盘还在闲置😂😂
    Huelse
        8
    Huelse  
       2023-02-04 19:54:22 +08:00   ❤️ 1
    因为固态盘自带的缓存设计不同,所以得小心使用。一般建议把固态作为下载的临时存储区,下载完了转机械盘这样用。
    a342191555
        9
    a342191555  
    OP
       2023-02-04 19:56:11 +08:00
    terranboy
        10
    terranboy  
       2023-02-04 19:56:31 +08:00   ❤️ 1
    建议不要用 SSD 缓存 建议内存大点
    a342191555
        11
    a342191555  
    OP
       2023-02-04 19:59:14 +08:00
    @dingdangnao #7 就,奇奇怪怪的,如果黑群自己还能看看,白群真没办法了👀


    @Huelse #8 群晖的 DSM 关于缓存是个黑盒,只要设置好后它会自动使用,无法手工做到“下载到临时的 SSD 存储”这件事。而且它也一直是作为“缓存”使用,随时移除也没有关系。
    ZeroClover
        12
    ZeroClover  
       2023-02-04 20:04:09 +08:00   ❤️ 1
    918 这玩意儿就是这样,我的 SSD 缓存也被它认为损毁,问题是插电脑上不管是诊断工具还是各种系统、FreeNAS 之类的都认为这盘一点儿问题没有。
    cue
        13
    cue  
       2023-02-04 20:07:09 +08:00 via iPhone   ❤️ 1
    你这还好,我的 920+已经在半年之内遭遇了 3 次硬盘损毁,( 2 块 4T 蓝盘,1 块 16T 的 HC550 )现在不得不用一块 2.5 寸 2TB sata ssd 顶着,要是固态也跪了我就砸了这破玩意,整个 NAS 还不够闹心的。
    xyjincan
        14
    xyjincan  
       2023-02-04 20:45:28 +08:00   ❤️ 1
    缓存盘用大容量的试试?
    mrzx
        15
    mrzx  
       2023-02-04 21:04:24 +08:00   ❤️ 1
    @a342191555 就是温度太高了,多贴一些散热片看看

    观察室温是没用的,主要是 2 块 SSD 放在 918 这么小的盒子里。怎么散热?

    后续看 SSD 发展都需要主动式散热了(加风扇)
    a342191555
        16
    a342191555  
    OP
       2023-02-04 21:48:47 +08:00
    @terranboy #10 上面有虚拟机、有 docker 跑数据库,内存永远不够用


    @ZeroClover #12 是的,又有一块空盘不知道拿来干什么用了


    @cue #13 HDD 损毁感觉更闹心,做 SHR 或者 RAID 的话,还要让它重建


    @xyjincan #14 缓存空间一直没用完,RAID1 之后可用 500G ,长期占用 100-200G ,可能再大也没有帮助


    @mrzx #15 我的意思是在它损毁刚发生的时候,在存储管理器里看过这块盘的温度,显示的就是 15-16 度,没有很热
    a342191555
        17
    a342191555  
    OP
       2023-02-04 21:50:13 +08:00
    @mrzx #15 的确没贴散热片,不过这次之后也懒得再搞 RAID-1 做缓存了,有点烦心
    Autonomous
        18
    Autonomous  
       2023-02-04 21:57:47 +08:00
    群晖的 SSD 缓存机制有问题,SSD 写入之后长时间不会释放,盘快写满时会有写入放大效应。推荐的做法是用 SSH 命令把 SSD 作为存储空间使用。
    1145148964
        19
    1145148964  
       2023-02-04 22:09:49 +08:00 via Android
    你需要企业级固态
    写 1pb 不眨眼那种
    SuperXX
        20
    SuperXX  
       2023-02-04 22:42:01 +08:00 via iPhone
    要不要试试 傲腾,就是容量比较小,Newegg P1600X 118Gb 打折 65 刀左右
    d7101120120
        21
    d7101120120  
       2023-02-04 23:32:21 +08:00
    我的 918+缓存使用的是金士顿 A1000 和铠侠的 RC20 ,都属于低端的 SSD ,不过并没有出现过问题。
    kappa
        22
    kappa  
       2023-02-04 23:51:08 +08:00
    之前做缓存两年挂了两根 Intel 的,重新买了还是改成独立的 Storage Pool 跑 Docker instance 了。。
    WhatTheBridgeSay
        23
    WhatTheBridgeSay  
       2023-02-05 00:46:00 +08:00
    群晖 DSM 就是动不动就报损毁的典型代表了,估计只有买群晖牌子的硬盘才能解决
    silymore
        24
    silymore  
       2023-02-05 03:50:14 +08:00 via iPhone
    @a342191555 坏掉盘的能走售后吗
    elfive
        25
    elfive  
       2023-02-05 06:51:37 +08:00 via iPhone
    楼主和我的 SSD 型号一模一样,不过我买得早,那个时候也是不到小半年,提示 SSD 损毁。我直接找 JD 换新的,然后配置成只读缓存,用了 3,4 年了,再也没出过问题。
    alfawei
        26
    alfawei  
       2023-02-05 10:46:39 +08:00 via iPhone
    @WhatTheBridgeSay 使用了白裙七年,黑裙 3 年 都沒有遇到損毀問題
    luciferlulu
        27
    luciferlulu  
       2023-02-05 11:03:45 +08:00 via Android
    我虚拟的硬盘都能损毁 一个 2t 的虚拟磁盘文件被群晖认为损毁了 当然我的群晖也是虚拟机里面安装的 至此群晖列入了我的黑名单 反正开着也是浪费 CPU
    zayia
        28
    zayia  
       2023-02-05 11:47:58 +08:00 via iPhone
    用 nas 快 5 年了,第一个是 ds218 ,第二个是黑群晖,第三个是 ds920+,就坏了一个 4t 红盘
    zcq100
        29
    zcq100  
       2023-02-05 12:12:35 +08:00
    群晖的损毁原因是磁盘阵列数据不同步,并不是硬盘出故障。用 basic 模式,基本上不再出现损毁。
    a342191555
        30
    a342191555  
    OP
       2023-02-05 13:07:29 +08:00
    @Autonomous #18 以前想过,后来懒就没管了🤣

    @1145148964 #19 @SuperXX #20 做缓存而已,这样的投入不如放在更有效的地方,比如内存或者干脆坏了就换

    @d7101120120 #21 我平时也没遇到问题,但两次出现 SSD 缓存损毁都发生在从 USB 硬盘拷贝大文件到 NAS 的存储池

    @kappa #22 挂的原因是什么呢

    @WhatTheBridgeSay #23 群晖对硬盘健康度的要求太苛刻了

    @silymore #24 可以,HP 坏掉的那坏向京东申请售后了。我觉得两个 HP 盘换下来之后,寿命不一样,就没继续用它们了。

    @elfive #25 你坏掉前发生了什么吗,还是突然间坏掉的。我之前用只读缓存也一直没问题。

    @alfawei #26 @zayia #28 很棒,你们的硬盘寿命也很长

    @luciferlulu #27 愿意折腾的话,自建 NAS 还是更好

    @zcq100 #29 basic 坏掉就彻底没了🤣
    sm1314
        31
    sm1314  
       2023-02-05 13:26:25 +08:00
    可以考虑买企业级 ssd 的洋垃圾 便宜耐操 有断电保护
    gogorush
        32
    gogorush  
       2023-02-05 13:41:27 +08:00
    我的 920 也坏了一个 感觉这个 ssd 的管理有点问题
    jiezhi
        33
    jiezhi  
       2023-02-05 13:57:09 +08:00
    920 插了 2 条 512 做读写缓存,前两天报一块故障,昨天拿出来换了位置后又继续用。不过提示缓存是上个版本 DSM 创建的,建议删了重新创建。
    manyeechen
        34
    manyeechen  
       2023-02-05 15:20:06 +08:00
    之前看到说缓存的容量要设置到 80%左右,不要全部设置就可以,还有就是损毁了还能用
    anyinuo0413
        35
    anyinuo0413  
       2023-02-05 16:57:11 +08:00
    曾经用 HP EX900 、EX920 掉盘 n 次,最后京东折价退款了
    findex
        36
    findex  
       2023-02-05 18:17:28 +08:00
    nas 怎么省都可以,就是不可以省硬盘。因为数据无价。

    推荐西数黑盘+hsgt 企业盘。
    红盘+紫盘(不考虑),最次蓝盘。SSD 上三星。
    balduncle
        37
    balduncle  
       2023-02-05 23:35:48 +08:00
    要缓存有什么用?我直接买的两块 hc550 ,直接下载在企业硬盘里面。系统盘是用的淘汰的 ssd 120g
    zx900930
        38
    zx900930  
       2023-02-05 23:55:34 +08:00
    我用 pve 自建 ssd 缓存池, 用的旧的 thinkpad 上拆下来的 intel nvme ssd
    用了几个月, 目前写入 10T 左右
    Percentage Used: 4%
    Data Units Read: 82,758,230 [42.3 TB]
    Data Units Written: 18,900,082 [9.67 TB]

    可以把 110MB/s 左右读写速度的 HDD 直接撑满 2.5G 网络带宽上限, 反正对我来说缓存就这么一个用处, 拆旧的笔记本也算是废物利用了.
    Ericality
        39
    Ericality  
       2023-02-06 00:56:01 +08:00
    群晖有缓存放大问题 上面有提到 个人用其实缓存意义不大 因为他只对小文件读写有一些效果 所谓放大就是在快满的时候只擦除最后一部份数据 然后写入 就导致单独的几个区块被反复磨损 进而导致硬盘寿命快速下降 最终损毁 所以建议一定上 ssd 缓存的话 只用额定空间的 80% 给 ssd 一些均衡损耗的空间
    peasant
        40
    peasant  
       2023-02-06 10:21:36 +08:00
    https://s3.bmp.ovh/imgs/2023/02/06/0f8791c3050a7b73.png
    带缓存的盘只用来备份自己的数据,用着一切正常,可能因为我存的东西比较少,下载的文件放在另外单独的盘了,不经过缓存
    goodsavage
        41
    goodsavage  
       2023-02-06 10:29:31 +08:00
    格式化重建就好了,会有随机崩溃的问题
    piku
        42
    piku  
       2023-02-06 11:04:09 +08:00
    黑裙能理解。白裙这个情况建议先检查供电性能问题?也不排除硬盘自身不行
    nkidgm
        43
    nkidgm  
       2023-02-06 12:07:54 +08:00   ❤️ 1
    DS 918+ 这款长期 24 小时开着早晚会翻车的,无一例外。
    它用的是 Intel Celeron J3455 ,这个 cpu 有时钟信号衰退的 bug ,属于硬件 bug ,无法通过更新 cpu 微码修复的。

    出处: https://news.mydrivers.com/1/645/645646.htm
    mapleincode
        44
    mapleincode  
       2023-02-06 15:40:10 +08:00   ❤️ 1
    题主是缓存损毁、缓存损毁、缓存损毁、缓存损毁

    前面不少回答都在硬盘损毁,这是两件事。

    先说我的情况,我有一个黑裙使用一根 256 的 SSD 作为读取缓存,之前有长期开机记录,未出现问题。

    题主的情况,感觉更像像是群辉自身的缓存机制问题。

    建议也是不使用缓存,因为群辉的缓存对于千兆网提升极为有限
    standin000
        45
    standin000  
       2023-02-06 21:19:17 +08:00
    @Autonomous 请教用 SSH 命令把 SSD 作为存储空间使用是啥意思,ssd 本来就可以做存储空间吧
    Autonomous
        46
    Autonomous  
       2023-02-06 21:32:24 +08:00
    @standin000 DS918 不允许 m.2 插槽位的 SSD 做存储空间,只能通过 SSH 打命令完成。

    请参阅:Use NVME SSD as storage volume instead of cache
    https://www.reddit.com/r/synology/comments/a7o44l/guide_use_nvme_ssd_as_storage_volume_instead_of/
    oyaxira
        47
    oyaxira  
       2023-02-10 11:36:01 +08:00
    都那么恐怖吗.
    我用的三星 980 x2 做的 ssd 缓存.
    ds920+ 跑了一年半了.长期开着 7x24 小时待机,不过任务不多,下载也不频繁,没遇到什么问题.
    GoodRui
        48
    GoodRui  
       2023-03-29 17:03:32 +08:00
    @Autonomous 7.2 可以用 nvme 固态做存储池了。
    Autonomous
        49
    Autonomous  
       2023-03-29 20:26:24 +08:00
    @GoodRui 除了群晖自己的 m.2 固态,还支持第三方固态吗?
    GoodRui
        50
    GoodRui  
       2023-03-31 08:24:04 +08:00
    @GoodRui 不知道啊...没用过
    Autonomous
        51
    Autonomous  
       2023-03-31 23:01:53 +08:00
    @GoodRui 有种说法是需要 DS923+这种新款 NAS ,还要配群晖自家的 m.2 固态才能支持在 DSM 做存储池。所以我还是继续敲命令
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   911 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 20:59 · PVG 04:59 · LAX 13:59 · JFK 16:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.