V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Just4L
V2EX  ›  程序员

关于基于 intel 编译编译的 openmpi4 运行多节点作业卡住咨询

  •  
  •   Just4L · 100 天前 · 580 次点击
    这是一个创建于 100 天前的主题,其中的信息可能已经有所发展或是发生改变。

    请教各位大佬,最近遇到一个问题,网上资料实在太少,遂来请教。

    1 、环境

    • 编译器:intel 非商业免费的 oneapi 安装 icc 、icpc 、ifort
    • openmpi:openmpi4 ,基于 icc 、icpc 编译,编译命令"./configure --prefix=/software/openmpi4 --without-psm CC=icc CXX=icpc FC=ifort"
    • 系统:centos7

    2 、现象

    2.1 单节点多进程

    单节点运行多进程没问题

    2.2 多节点多进程

    程序会 hang 住,会在 complete_setup 处卡住 pFkbjxK.png

    请问有没有大佬可以帮忙指点一二的

    2 条回复    2024-01-18 15:17:03 +08:00
    xchaoinfo
        1
    xchaoinfo  
       100 天前
    测试下 ssh 免密登录是否配置好了, 记得要 ssh 包括自己在内的所有节点。
    Just4L
        2
    Just4L  
    OP
       100 天前
    @xchaoinfo #1 你好,ssh 免密登陆都做好了,包括自己和其他节点。
    就是同样配置,设置。非 intel 编译的 openmpi 运行就没有问题。intel 编译的就会遇到,所以想问下是不是 intel 编译 openmpi 的时候有些什么特殊设置来着
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2959 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:08 · PVG 22:08 · LAX 07:08 · JFK 10:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.