V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ihjk
V2EX  ›  程序员

“上交所通过重启系统解决堵单问题”请问下这玩意很难升级吗?

  •  
  •   ihjk · 1 天前 · 3279 次点击

    9 月 27 日周五上交所遭遇了堵单问题,当天的交易量大幅下降。为了解决问题,上交所最后选择了重启交易系统,问题随后真的解决了。财新援引专业人士的消息报道,交易所的操作系统较为古老,在处理高并发任务时遇到瓶颈,尤其是在内存管理方面;当系统负载过高,内存被耗尽,导致程序无法正常处理请求,甚至完全卡死。「在这种情况下,重启系统可以清理内存,释放被占用的资源,从而让系统恢复正常。这种现象在较老的系统中更为常见,因为它们的内存管理和资源调配机制相对简单,不如现代操作系统那样高效。」这位专业人士说,可以增加几条简单的操作系统命令,将缓存中的数据写入硬盘,释放内存空间。上交所的交易系统源自德意志交易所的 Xetra 交易系统,而该系统是基于一款 VAX/VMS 的操作系统,由 DEC 在 1970 年代末推出,DEC 早已停止开发,了解该系统的专业人士也非常少。

    https://weekly.caixin.com/2024-10-12/102244348.html

    34 条回复    2024-10-15 20:32:05 +08:00
    StinkyTofus
        1
    StinkyTofus  
       1 天前   ❤️ 2
    能跑就别轻易动。 重启就能解决, 多么幸福。
    cvbnt
        2
    cvbnt  
       1 天前 via Android
    大型系统难的是业务逻辑
    RightHand
        3
    RightHand  
       1 天前 via Android   ❤️ 3
    20 多年的屎堆,谁敢动
    Noicdi
        4
    Noicdi  
       1 天前 via iPhone
    我们系统想升级个 Linux 发行版的大版本都一堆问题,何况上交所这个系统。
    上交所想升级估计是往 Linux 转移,又是底层架构又是业务代码,谁敢动啊这😧
    felixlong
        5
    felixlong  
       1 天前
    维护这个系统的人应该很爽呀。不用担心 35 岁被裁:)
    levelworm
        6
    levelworm  
       1 天前 via Android
    @felixlong 平时一大堆事情压力应该也很大的。
    jdgui
        7
    jdgui  
       1 天前
    他最早设立的时候的代码,估计都是找外国公司买的代码。后面不知道加了多少版本的代码进去。
    大部分人维护的系统,撑死只有几年的开发时间。整个 v 站没有几个有维护三十几年的代码吧。
    重启能解决就挺好的了。这玩意如果能花大价钱去重构一次,可能会好一点。但是没有收益的事情谁去做
    testonly
        8
    testonly  
       1 天前
    @felixlong 九代单传传下来的谋生秘技,传里不传外,传子不传女
    lesismal
        9
    lesismal  
       1 天前
    平滑过度的话, 单独开发一套新系统, 一部分用户数据复制/迁移过去, 代理层分流这部分用户流量给新系统, 灰度一段时间如果功能都稳定就可以考虑继续迁移直到全切过去.
    至于性能, 新系统的话, 随便哪个大厂的一流团队支援下, 就像当年阿里支援 12306 一样, 性能都能搞定的.
    hefish
        10
    hefish  
       1 天前
    早年听大佬吹牛时讲过,说上交所的多处理器系统是一条指令,多个 cpu 跑,然后表决结果的。当时觉得牛逼的不行。。。
    要真如 op 所讲,还是基于 vax/vms 的,到今天肯定是相对落后了。
    lxh1983
        11
    lxh1983  
       1 天前 via iPhone
    @felixlong 正式工可得有关系,临时工就是来背锅的,爽不爽不取决于工作内容
    yxzblue
        12
    yxzblue  
       1 天前
    很爽有没有。没人能动得了,也不会轻易堆屎需求进去。出了问题,重启就行,也不用加班加点修 bug 。简直是程序员的福音。
    hermanarturo
        13
    hermanarturo  
       1 天前
    交易所这点工资能留得住啥人
    mohumohu
        14
    mohumohu  
       1 天前   ❤️ 1
    复盘上交所爆单宕机事件:问题源于信创 最后靠重启系统解决

    9 月 27 日,上交所因系统负载过高导致交易缓慢异常,部分券商客户端崩溃。尽管成交量不大,但交易堵塞依然严重。9 月 29 日,问题通过重启系统解决。专业人士指出,问题源于上交所老旧的系统在高负载下内存耗尽,而信创改造导致的兼容性问题也可能是关键原因之一。

    相比之下,深交所的交易系统尚未出现异常。据悉,深交所的系统早期源于 IBM 的一套技术,后买下版权自主研发出了第五代交易系统⸺STSV5 ,完全基于开放平台和分布式架构,于 2016 年 6 月上线。

    cnbeta
    1145148964
        15
    1145148964  
       1 天前
    必然是有人需要做一些事情才坏的。
    03
        16
    03  
       1 天前 via Android   ❤️ 4
    @lesismal 部分?灰度?交易所可不像互联网一部分用户打不开或者卡了也没什么。到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司
    ivvei
        17
    ivvei  
       1 天前
    不难。就是上交所垃圾罢了。垃圾人办垃圾事。

    不过这类报道里的“专业人士”也是垃圾,不知道是本人屁都不懂,还是记者听个一知半解就瞎写。
    chendy
        18
    chendy  
       23 小时 45 分钟前
    不是很难是非常难
    这种系统能通过重启解决已经算好的了
    有多少系统,意外关机一次就再也没起来过…
    Leon777
        19
    Leon777  
       23 小时 19 分钟前 via iPhone
    在这种单位的技术部门干活就讲究一个不求有功但求无过,升级了没出问题没功劳,出了问题你背锅检讨上会批评
    jimrok
        20
    jimrok  
       23 小时 18 分钟前
    这种系统非常庞大,对接的外部系统也非常多,没有几个人能懂整个系统的全貌。虽然周末券商也配合做系统测试,但只有半天时间,只能做些小的修复。要想更新这个系统,除非有人做破坏性的创新才行。
    mosfet
        21
    mosfet  
       23 小时 11 分钟前   ❤️ 1
    上交所基本靠外包
    深交所有自己开发迭代的能力
    iorilu
        22
    iorilu  
       22 小时 59 分钟前
    很惊险阿

    要是重启不成功, 就完球了

    这种老系统, 重启一次都是大事, 不成功很正常
    iorilu
        23
    iorilu  
       22 小时 58 分钟前
    @jimrok 别更新了, 重开发一个拉到

    这种老东西没更新价值
    cheng812
        24
    cheng812  
       22 小时 52 分钟前   ❤️ 1
    深交所交易额更大却没问题,上交所不是第一次出问题了

    @03 有办法的,例如先和旧系统并行一段时间,用户数据同时提交到两个系统,新系统只做内部测试
    yc8332
        25
    yc8332  
       22 小时 50 分钟前
    这种系统怎么可能临时升级。。。你以为都像互联网行业啊
    Sawyerhou
        26
    Sawyerhou  
       21 小时 38 分钟前
    这么复杂的系统,谁感动啊,别说更新系统,换个内存条都瑟瑟发抖。
    lesismal
        27
    lesismal  
       19 小时 9 分钟前
    @03 #16 要是信心和实力足够, 直接上一套新的也行.


    按照其他层说的, 如果是采购的别人现成的不好改造, 那灰度确实很难搞. 如果可以改造, 那么:

    > 到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司

    灰度可以从很小的用户数量开始, 可没说你得一半新一半旧;
    可以是内部或者相关机构开放一部分账户进行测试, 可没说必须都让普通用户先上去直接当炮灰


    > 部分?灰度?交易所可不像互联网一部分用户打不开或者卡了也没什么。

    所有用户全用不了的影响大, 还是少量人不能用影响大?

    别瞧不起互联网, 支付宝微信这些 FIN Tech, 哪个不是涉及钱的

    撮合系统的算法服务部分应该是没太大压力, 因为本来就可以按照股票 id 分散到不同的撮合节点, 卡住主要是订单和结算这些数据事务性相关的, 解决这部分性能, 撮合系统把交易来源和结算的部分按照用户分流到新旧不同的系统就可以了, 但业务上肯定影响挺大的, 改造肯定是要喝一壶的
    lesismal
        28
    lesismal  
       19 小时 2 分钟前
    > 到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司

    @03 而且, 如果照这么说, 价格高低好歹能成交, 节前那次被卡单的连成交都成交不了让人家上不了车, 早都该去告上交所了
    dfkjgklfdjg
        29
    dfkjgklfdjg  
       18 小时 11 分钟前
    谁来牵头,谁来负责?
    我不知道在场的有多少人会愿意赌上自己的工作,去主动提“升级”这个系统?
    lhDream
        30
    lhDream  
       18 小时 10 分钟前
    别说了,准备做个 T,结果卖卖不出去,撤撤不了,第二天一看,直接下车了
    www12222
        31
    www12222  
       17 小时 38 分钟前
    上交所听说老人跑了还多,招了一堆 7-8k 的应届生,能做成这样不错了
    ccxuy
        32
    ccxuy  
       15 小时 12 分钟前
    https://www.hyrumslaw.com/
    海拉姆法则,越大型的软件应用,使用规模越大,就会出现 bug for bug 的使用,哪怕是一些隐含的约束都会被利用起来,你做变更就会牵一发动全身。
    ccxuy
        33
    ccxuy  
       15 小时 9 分钟前
    现在业界的建议一般是既然变更困难又得用大型软件,比如 Linux ,还是花些功夫频繁点接轨到主线稳定版本,这样能兼顾 bug 、漏洞和平滑一些变更难度
    cskeleton
        34
    cskeleton  
       11 小时 43 分钟前
    @lesismal #27 我觉得还是前面 @cheng812 说的并行提交靠谱一些。

    > 所有用户全用不了的影响大, 还是少量人不能用影响大?

    我认为少量人不能用影响大。所有人都用不了大家都不交易,等系统恢复了继续;一部分人用不了就是系统带来的不公平性问题了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3496 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 00:15 · PVG 08:15 · LAX 17:15 · JFK 20:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.