V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
suifengingo
V2EX  ›  问与答

神经网络模型在训练第一个 Epoch 报出 Warning 然后继续从头开始训练循环往复,请问如何解决?

  •  
  •   suifengingo · 2020-08-30 17:51:41 +08:00 · 1029 次点击
    这是一个创建于 1306 天前的主题,其中的信息可能已经有所发展或是发生改变。
    神经网络模型在第一个 Epoch 训练时,报错“12872/21931 [================>.............] - ETA: 3:55:38 - loss: 1.8393 - accuracy: 0.7415/usr/local/python3/lib/python3.6/site-packages/keras/utils/data_utils.py:616: UserWarning: The input 12494 could not be retrieved. It could be because a worker has died.”
    然后就会继续从第一个 Epoch 开始重新进行训练,请问这种情况如何解决?先谢谢了!
    4 条回复    2020-09-01 19:56:03 +08:00
    imn1
        1
    imn1  
       2020-08-30 18:45:51 +08:00
    你用你的出错信息去搜搜,so 和 git issues 都有类似的提问,自行参考
    suifengingo
        2
    suifengingo  
    OP
       2020-08-30 19:13:37 +08:00
    @imn1 搜索无果,便来万能的 V 站求助
    superlc
        3
    superlc  
       2020-08-31 12:51:54 +08:00 via iPhone
    keras 没用过,如果是 pytorch 的话出现类似的情况可以把 shuffle 关掉然后记下来数据 id,先看下是不是每次都挂在同一个样本上,是这个样本有问题还是程序有问题
    suifengingo
        4
    suifengingo  
    OP
       2020-09-01 19:56:03 +08:00
    @superlc 程序好像没问题,之前类别少且批次为 16 的时候就可以正常运行,现如今类别多改为 64 后报出这样的警告,后来改为 16 后仍会报错,实在是不知道该怎么办了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4787 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 09:58 · PVG 17:58 · LAX 02:58 · JFK 05:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.