V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Event
V2EX  ›  问与答

cpu 一般都是有个数限制的,我所知道的最多也就是志强系列的八路,那么超算是如何实现动辄上万计算节点的呢

  •  
  •   Event · 2018-11-17 20:37:20 +08:00 via Android · 3635 次点击
    这是一个创建于 2225 天前的主题,其中的信息可能已经有所发展或是发生改变。
    15 条回复    2018-11-18 10:57:18 +08:00
    niubee1
        1
    niubee1  
       2018-11-17 20:47:37 +08:00
    你都说一般了嘛, 超算就是通过不一般的方法咯撒
    zhichangxinren
        2
    zhichangxinren  
       2018-11-17 20:59:18 +08:00 via Android
    并行计算
    yexm0
        3
    yexm0  
       2018-11-17 21:09:13 +08:00
    超算是用的类似 Intel Xeon Phi 这类的特殊 U,不是一般机子的通用 U
    Event
        4
    Event  
    OP
       2018-11-17 22:05:08 +08:00
    @zhichangxinren 不同节点通过网络连接吗 那岂不是会有延迟 哪怕 1ms 也是很严重的把
    F1024
        5
    F1024  
       2018-11-17 22:30:51 +08:00
    eastpiger
        6
    eastpiger  
       2018-11-17 22:34:30 +08:00   ❤️ 2
    前面说的已经比较清楚了。超算并不是你想象的一个上万核的 CPU 这种东西。
    至于你说的网络,很多超算就是通过网线连接的,至于延迟,你可以计算一下 1ms 乘上光速有多少。况且并行计算的算法设计一般是要针对性设计的,其中很大一部分精力就是在组织数据和分配计算任务上。
    Event
        7
    Event  
    OP
       2018-11-17 22:48:10 +08:00
    @eastpiger soga
    明白了 thks
    Osk
        8
    Osk  
       2018-11-17 22:50:31 +08:00
    把一个大型的任务精心设计成可以独立运行的多个小任务, 分配到各节点进行计算, 最后处理所以节点计算的结果, 已经不是个人机上那种多进程多线程了. 忘了是在哪里看到的了. 每个节点的 cpu 核数也不一定多, 看整个系统怎么设计的
    Laynooor
        9
    Laynooor  
       2018-11-17 23:00:22 +08:00 via Android
    @F1024 这个视频,运行快速傅立叶变换的时候,超算和个人电脑比较。

    从画面上看个人电脑只有一个核心....
    ryd994
        10
    ryd994  
       2018-11-17 23:33:36 +08:00 via iPhone
    @eastpiger 不是普通网络
    首先就不是基于 ethernet 协议
    比如说 IBM 超算就是 5 维双向环路,分配计算任务时会跟随环路方向,最大化数据同步效率

    @Osk mpi 了解一下
    @Event 1ms 怎么可能,都在亚微秒级
    Twot
        11
    Twot  
       2018-11-17 23:47:15 +08:00 via Android
    分成一个个小任务然后配合类似 slurm 这种调度来计算吧。。
    hsheng
        12
    hsheng  
       2018-11-18 00:15:50 +08:00 via Android
    @eastpiger #6 一般不用普通的网线,延迟太高,都是通过 infiniband 连接各节点
    andyhuzhill
        13
    andyhuzhill  
       2018-11-18 00:31:22 +08:00
    超算的关键技术点其实不是堆砌 CPU,只是堆砌 CPU 并不能带来性能的一直提升,是有瓶颈的。
    超算的关键技术就是各个 CPU 之间的互联网络 和 计算任务的分配。
    pkookp8
        14
    pkookp8  
       2018-11-18 01:39:50 +08:00 via Android
    所以才是技术
    不然有钱堆硬件就够了
    msg7086
        15
    msg7086  
       2018-11-18 10:57:18 +08:00
    1ms 够光走 300 米了。担心 1ms 延迟不如把服务器节点搬得近一点。
    另外你可以了解一下 NUMA。跨 NUMA 存取是很慢的,所以一般会把大部分 IO 限制在节点内,提高工作速度。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2027 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 00:32 · PVG 08:32 · LAX 16:32 · JFK 19:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.