V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
Sklinux
V2EX  ›  云计算

阿里云新加坡-c 区火灾

  •  1
     
  •   Sklinux · 102 天前 · 14043 次点击
    这是一个创建于 102 天前的主题,其中的信息可能已经有所发展或是发生改变。

    [进展更新] 异常因新加坡机房发生火灾导致升温,消防人员已到达现场处置中,云网络大部分产品及云安全产品于 10:55 已完成主动切换,其他云产品服务仍在处理中。请您尽快迁移业务。

    尊敬的客户:您好!北京时间 2024 年 09 月 10 日 10:20 ,阿里云监控发现新加坡地域可用区 C 网络访问出现异常,部分云产品服务出现异常,阿里云工程师正在紧急处理中。若有任何问题,请随时联系我们。

    88 条回复    2024-09-14 18:24:09 +08:00
    daxy223
        1
    daxy223  
       102 天前
    OSS 现在还是不可用
    tabliu
        2
    tabliu  
       102 天前
    听说可能会停电
    huangzhiyia
        3
    huangzhiyia  
       102 天前
    aws 和 阿里云不在一个机房?
    quan01994
        4
    quan01994  
       102 天前
    网站功能受到影响 。
    wusheng0
        5
    wusheng0  
       102 天前
    22 年香港宕机仿佛历历在目
    Felldeadbird
        6
    Felldeadbird  
       102 天前
    所以云计算机不是机房发生爆炸后,(整体业务)自动迁移到容灾机房吗?
    YiCheng88
        7
    YiCheng88  
       102 天前
    系统崩了一半
    glcolof
        8
    glcolof  
       102 天前
    集中度越高的系统,抗风险能力越差。现在的“云计算”就是一个不断增加集中度的系统,随着设备老化和人员更迭,以后“云计算”的问题会越来越多、越来越严重……
    janwarlen
        9
    janwarlen  
       102 天前
    😑,好几个小时了,现在在做迁移可用区,但是迁移这个进度也靠他们的人操作

    这个也不知道要多久


    崩溃了
    tyrone2333
        10
    tyrone2333  
       102 天前
    公司上午就把人都叫在会议室救火, 充值用不了老板急死了🤡 连都连不上救个毛线
    colinlikepotatos
        11
    colinlikepotatos  
       102 天前
    吓我一跳,仔细看了 新加坡的服务器在亚马逊
    newmancity
        12
    newmancity  
       102 天前
    @zmaplex 都有各自的数据中心吧
    daimaosix
        13
    daimaosix  
       102 天前 via Android
    @tyrone2333 快想办法兄弟
    mb4555
        14
    mb4555  
       102 天前
    真的是日了狗了
    MozzieW
        15
    MozzieW  
       102 天前
    感谢。花了 20 分钟检查
    MozzieW
        16
    MozzieW  
       102 天前
    没打完发出去了

    感谢。花了 20 分钟检查影响,10 分钟向上报告,30 分钟迁移。
    得到评价“还好你看到了这个”。

    话说你们那里看到公告到?今天摸鱼少,差点没看到。
    Jerry23333
        17
    Jerry23333  
       102 天前   ❤️ 1
    @Felldeadbird #6 也要看买的服务了,以数据库为例,分了基础版和高可用版,高可用版是一主一从的,如果主出了问题是会做 HA 切换的。但是如果买的基础版或者是主从在一个可用区,这时候就算是重新找个机房进行恢复,那也是很慢的,需要进行备份恢复。
    PerFectTime
        18
    PerFectTime  
       102 天前   ❤️ 22
    防火墙没起作用吗?[:/doge]
    pkxutao
        19
    pkxutao  
       102 天前
    @MozzieW #16 请问你们说的“迁移”是怎么迁移的?
    CJAmoy
        20
    CJAmoy  
       102 天前 via Android
    估计大部分都能用吧,不然早挂热搜了
    coderxy
        21
    coderxy  
       102 天前
    oss 的本地冗余版挂了。。。 还好其它组件都是多可用区高可用的。
    hliman
        22
    hliman  
       102 天前
    hologres 现在还没恢复
    MozzieW
        23
    MozzieW  
       102 天前
    @pkxutao 我们受到影响的是几个 OSS ,创建新的 bucket ,上传文件上去,修改 DNS 把流量切过去就可以了。
    有一些文件暂时没有,或者不重要,就先不管。

    楼上有说连不上救不了的,那是因为数据都是服务器上,连不上没有办法了。如果有备份的话,可以创建新服务器,重新把服务跑起来就可以了。

    “迁移”这个词,对应的意思,差不多是新租(买)一个家,把原来家里的东西都搬过去,以后就去新家。
    hyseiya
        24
    hyseiya  
       102 天前
    22 年香港宕机后,阿里云从此是路人
    Kiske
        25
    Kiske  
       102 天前   ❤️ 11
    “人心若是烧没了,修好一座破庙又有什么用呢?”
    Tink
        26
    Tink  
       102 天前
    轻量云分区域吗,也是新加坡
    bzw875
        27
    bzw875  
       102 天前
    我们公司也受影响了
    liuzimin
        28
    liuzimin  
       102 天前
    @hyseiya 那现在哪家云要更靠谱些?
    xclimbing
        29
    xclimbing  
       102 天前   ❤️ 10
    真是可笑,云服务的本意就是避免这种单点故障的,那它这个跟托管服务器有啥区别呢?
    kenneth104
        30
    kenneth104  
       102 天前
    火熄了没?服务器泡水了没?
    dyllen
        31
    dyllen  
       102 天前
    @MozzieW 连不上原来的机房你怎么迁移?拿自己的备份数据在新机房重新启动一个?丢失一段时间的数据?还是等原来的可以了再人工合并数据?
    tyrone2333
        32
    tyrone2333  
       102 天前
    @hyseiya 阿里云是真小丑🤡国内外都是, 一年起码 2 次特大事故, 老板天天说要换其他厂商,东西太多一直没迁移
    hyseiya
        33
    hyseiya  
       102 天前
    @liuzimin azure
    me1onsoda
        34
    me1onsoda  
       102 天前
    @xclimbing 云服务一般也提供了高可用版 花单机的钱想得到高可用的服务,那不太现实
    Plutooo
        35
    Plutooo  
       102 天前
    阿里云画的饼两地三中心怎么不好使
    xcsoft
        36
    xcsoft  
       102 天前
    @Plutooo 咱就是说,两地三中心 和用户的服务器没啥大关系吧
    MozzieW
        37
    MozzieW  
       102 天前
    @dyllen 我迁移的是 OSS ,数据在其他地方有。有些数据没有了就先不管
    qqjt
        38
    qqjt  
       102 天前
    这故障是越来越离谱了
    pkxutao
        39
    pkxutao  
       102 天前
    @MozzieW #23 请问“修改 DNS ”是什么意思?你们能控制客户端的 DNS 吗?为什么不直接改域名映射呢
    huangzhiyia
        40
    huangzhiyia  
       102 天前
    MozzieW
        41
    MozzieW  
       102 天前   ❤️ 1
    @pkxutao #39 修改 DNS 解析,就是把域名指向新的地址,客户端用的 DNS ,数据是服务器端配置的。应该就是你理解的“域名映射”。
    crc8
        42
    crc8  
       102 天前   ❤️ 4
    火烧云
    opengps
        43
    opengps  
       102 天前   ❤️ 1
    @Plutooo 你买的服务器,只是一个可用区这个云里的一部分资源,并不是两地三中心里的资源
    zictos
        44
    zictos  
       102 天前
    用的轻量,还能用,轻量好像没有可用区一说
    mb4555
        45
    mb4555  
       102 天前
    cjb
    just1
        46
    just1  
       102 天前 via Android
    @zictos 当然有可用区,可用区对应的是物理机房。只是可能你不在 c 而已
    Maser
        47
    Maser  
       102 天前
    阿里云这恢复没那么快吧
    flyqie
        48
    flyqie  
       102 天前   ❤️ 3
    上次是香港消防水灾

    这次是新加坡火灾

    阿里云这是跟水火杠上了?
    daxy223
        49
    daxy223  
       101 天前 via iPhone
    OSS 现在还是不可用🤯🤯🤯
    pkxutao
        50
    pkxutao  
       101 天前
    @MozzieW #41 谢谢,那和我理解的一样了
    Jerry23333
        51
    Jerry23333  
       101 天前
    @xclimbing #29 云服务也分单可用区部署和多可用区。以数据库为例,购买分了基础版和高可用版,高可用版又分了单可用区部署和多可用区部署。如果你买的是高可用版本,且是多可用区的,一旦出现主实例不可用,是自动会切换的。进度里也提到了“ [进展更新] 截至 11:30 按照产品调度策略,云数据库 Redis/MongoDB/RDS MySQL 、对象存储 OSS 、表格存储 OTS 等云产品的**高可用版本**已陆续完成容灾切换。”。但如果你买的基础版,服务器出问题了那谁也没办法,自己部署也是一样的。
    花多少钱,干多少事。
    corcre
        52
    corcre  
       101 天前
    @tyrone2333 怎么在会议室救火, 去新加坡救火啊🐶🐶🐶
    iyahd
        53
    iyahd  
       101 天前
    售后工程师
    2024-09-11 08:37:41
    您好,截至目前,得到工程师最新的消息:暂不影响数据,我们会全力进行保障,目前仅是业务不可访问。

    只想数据别丢,还没来得及备份,哭死
    yb2313
        54
    yb2313  
       101 天前
    阿里 25 岁了
    vone
        55
    vone  
       101 天前
    liuzimin
        56
    liuzimin  
       101 天前
    @MozzieW 我提工单的时候,顶栏显示了一个显眼的横符,有写这次故障。
    Aerys
        57
    Aerys  
       101 天前
    @flyqie 水深火热警告 [:/doge]
    Cheivin
        58
    Cheivin  
       101 天前
    @glcolof #8 开猿节流过后,阿里云上问个东西,客服和工程师说的各是各的,头大
    iceprosurface
        59
    iceprosurface  
       101 天前
    @zictos

    我的服务器就在 C 区,整个机器都连不上了。现在都没恢复,还是得靠自己做容灾,切备份节点了
    Nicklove
        60
    Nicklove  
       101 天前
    @vone 一般机房灭火都是放气,不会有浇水的
    ninja911
        61
    ninja911  
       101 天前
    会不会赔偿啊? 以自己损失评估,而不是阿里补充使用时长
    polo3584
        62
    polo3584  
       101 天前
    昨天恢复了,今天又不行了
    Features
        63
    Features  
       101 天前
    又是哪位高管要销账呢?
    YiCheng88
        64
    YiCheng88  
       101 天前
    24h 都没恢复 麻了
    EthanLau
        65
    EthanLau  
       101 天前   ❤️ 2
    我们把数据库和服务器全迁到了可用区 B ,搞了一个晚上
    hoythan
        66
    hoythan  
       101 天前
    是不是没有请大师过来做法事导致的,按照阿里的佛性来说,这种大型的业务都必须找几个和尚才对。
    fengfisher3
        67
    fengfisher3  
       101 天前
    @EthanLau 具体是怎么迁移的。是哪些产品?真学习脸。
    jfds
        68
    jfds  
       101 天前
    买的是两地三中心的规格嘛?你不会以为所有实例都支持跨地域容灾吧
    sakeven
        69
    sakeven  
       101 天前
    @ninja911 只可能以你实际用的服务价格来赔偿。没有赔偿间接损失的做法的
    EthanLau
        70
    EthanLau  
       101 天前   ❤️ 1
    @fengfisher3 也没有特别复杂,RDS 和 redis 阿里云有直接提供迁移可用区的功能,ECS 直接拿快照打个镜像重新在其他可用区开新的服务器就行了,我们服务器不多所以搞了一个晚上基本就弄完了,万幸是 OSS 和 SLB 没有受到影响
    cover
        71
    cover  
       101 天前
    @Nicklove 已经泡水了
    fengfisher3
        72
    fengfisher3  
       101 天前
    @EthanLau 数据没丢就好。
    cndns
        73
    cndns  
       101 天前
    阿里云的 IDC 基建这么差的吗
    byweilong
        74
    byweilong  
       101 天前
    阿里的通知了,c 区搬走,还得几天时间恢复。。我们 50p 数据 业务全挂
    mytsing520
        75
    mytsing520  
       101 天前
    更新了,内容要点:
    1.大部分已恢复正常服务;
    2.现场团队尚未被获准进入机房;
    3.做好物理迁移服务器的应急准备,确定无法恢复后立即迁移
    MrDavidJones
        76
    MrDavidJones  
       101 天前
    每年都有重大事故 已经变成年货了
    kenvix
        77
    kenvix  
       101 天前
    数据上云了,乐
    8n1AfdFQWA5CWTNQ
        78
    8n1AfdFQWA5CWTNQ  
       100 天前 via iPhone
    上云後,公安一個電話數據就拷過去了
    good1uck
        79
    good1uck  
       100 天前
    @crc8 项目批准了!你负责做这个项目!
    cwr31
        80
    cwr31  
       100 天前 via iPhone
    @byweilong 数据会丢么?
    zhupite2
        81
    zhupite2  
       100 天前
    10 号这天下午,我测试恢复过一会,第二天发现又不行了,说是大楼断电。

    然后直到现在,都是不可用状态!

    我寻思难道鸡蛋都放这一栋楼里?
    zhupite2
        82
    zhupite2  
       100 天前
    @zhupite2 对了,说的是 OSS
    zhupite2
        83
    zhupite2  
       100 天前
    @zhupite2 #81 看了一下我的 bucket 冗余类型是“本地冗余存储”,似乎还真的是鸡蛋都放一栋楼里了🙄
    qq1427168550
        84
    qq1427168550  
       100 天前
    @tyrone2333 alyunflc ,aws 或者大陆华为云都可以看看
    qq1427168550
        85
    qq1427168550  
       100 天前
    @EthanLau 可以交流看看,商务折扣,阿里 aws 都涉及
    wunonglin
        86
    wunonglin  
       100 天前
    [进展更新] 09 月 12 日 17:25 ,运维人员已获准进入大楼一层区域,正在现场评估安全迁移条件,并对硬件设备进行紧急保全。

    https://status.aliyun.com/#/eventDetail?eventId=21
    XDiLa
        87
    XDiLa  
       98 天前
    @Cheivin 只能说你是小客户, 大客户都有 7*24 的群的 里面只有技术没客服
    Cheivin
        88
    Cheivin  
       98 天前
    @XDiLa #87 小作坊混口饭吃罢了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:22 · PVG 01:22 · LAX 09:22 · JFK 12:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.