V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xianxia
V2EX  ›  程序员

大佬们,没有明显逻辑错误的线上报错应该如何排查。

  •  
  •   xianxia · 328 天前 · 1561 次点击
    这是一个创建于 328 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景:公司的某项业务,程序可以正常执行,但是执行结果不对,得到的数据不全。

    排查方式:看了遍代码逻辑,没有明显的逻辑问题,看了眼处理后的数据库中数据,除了不全以外没有问题,要同步过来的数据也都是符合要求的。

    问题:像这种的问题,应该如何排查比较好。涉及公司业务,说的有点含糊,大佬们见谅。

    21 条回复    2023-12-28 09:36:25 +08:00
    liprais
        1
    liprais  
       328 天前
    用 left join 不用 inner join
    xianxia
        2
    xianxia  
    OP
       328 天前
    @liprais 排查不出来原因,现在还不敢动代码,线上报错,有什么比较好的排查方式吗
    gzq1989891
        3
    gzq1989891  
       328 天前
    部署链路跟踪,增加业务处理日志。
    AntiFraud
        4
    AntiFraud  
       328 天前   ❤️ 1
    笨方法,增加若干日志,一路追踪数据变化。
    helloeather
        5
    helloeather  
       328 天前
    大胆猜测,打日志验证
    connor123
        6
    connor123  
       328 天前   ❤️ 1
    看到大家都是打日志我就放心了
    Light3
        7
    Light3  
       328 天前
    往 txt 里面写返回呗
    这也能报错的吗?
    winglight2016
        8
    winglight2016  
       328 天前
    全链路跟踪都没有吗? java 是最容易实现的了
    nice2cu
        9
    nice2cu  
       328 天前   ❤️ 1
    打日志+1
    a582102953
        10
    a582102953  
       328 天前
    打日志观察数据,这个没有别的办法
    zapper
        11
    zapper  
       328 天前
    可能原始数据存在特殊数据处理异常丢弃了
    不懂你什么语言。是不是内存不够申请失败丢了一些数据,监控一下机器状态
    数据处理太久丢弃后续了。看全链路检测那个方法耗时太多

    大杀器:打日志
    mxw0204
        12
    mxw0204  
       327 天前
    传个 arthas 上去?
    xianxia
        13
    xianxia  
    OP
       327 天前
    @Light3 处理后的数据是回填到数据库中的,不是报错,只回填了部分数据。
    xianxia
        14
    xianxia  
    OP
       327 天前
    @mxw0204 我搜下文档
    xianxia
        15
    xianxia  
    OP
       327 天前
    @winglight2016 大佬,有可以参考的博客或文档吗
    LiaoMatt
        16
    LiaoMatt  
       327 天前
    Java 项目的话, arthas 运行时切入程序, 观察参数和返回值
    winglight2016
        17
    winglight2016  
       327 天前
    @xianxia 看你的运行环境吧,我们在阿里云的 k8s 上,有 SLS 上的 trace 服务,直接外挂在 pod 上,日志详细到方法级,不需要改代码。

    其他环境应该也是类似,运行命令,设置 agent ,开源的库应该也有
    imokkkk
        18
    imokkkk  
       327 天前
    远程 debug 或者 arthas
    xianxia
        19
    xianxia  
    OP
       326 天前
    @imokkkk 大佬,怎么远程 debug 啊.
    xianxia
        20
    xianxia  
    OP
       326 天前
    @zapper 原数据是正常没有问题的,至于机器内存缺失不足会丢失部分数据,有这种可能,目前资源不足,使用 spark 执行的导入任务。

    已经打日志了,等待代码部署后排查。
    imokkkk
        21
    imokkkk  
       326 天前
    @xianxia #19 网上很多教程的 类似这种 https://blog.csdn.net/weixin_45565886/article/details/126662703
    不过 debug 过程中断点一样会阻塞线上应用 记得提前把 debug 的节点从流量中摘出来
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3244 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 12:41 · PVG 20:41 · LAX 04:41 · JFK 07:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.