V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yiqunz
V2EX  ›  Java

Java ITEXT 对 pdf 文本部分文本进行隐藏处理求助

  •  
  •   yiqunz · 69 天前 · 558 次点击
    这是一个创建于 69 天前的主题,其中的信息可能已经有所发展或是发生改变。

    JAVA ITEXT 对 pdf 文本进行处理

    需求:隐藏敏感数据,比如把 pdf 里的电话号码删除

    问题点:目前使用白色遮挡层去实现,生成的 pdf 表面是去除了电话号码。 但是在空白区域里还是能将电话号码复制出来。

            PdfContentByte canvas = pdfStamper.getOverContent(1);
            canvas.saveState();
            //白色遮挡层
            canvas.setColorFill(BaseColor.WHITE);
    

    不知道各位大佬有什么其他的实现方式处理

    9 条回复    2021-11-11 10:11:59 +08:00
    wowo243
        1
    wowo243  
       69 天前
    为啥不直接删除,还覆盖一层
    yiqunz
        2
    yiqunz  
    OP
       69 天前
    @wowo243 怎么删?
    yinzhili
        3
    yinzhili  
       69 天前
    如果是自己生成的 PDF ,在生成之前就抹掉敏感数据是最简单的
    yiqunz
        4
    yiqunz  
    OP
       69 天前
    @yinzhili 这。。我当然知道,处理别人上传的 pdf 。。
    buliugu
        5
    buliugu  
       69 天前
    读取之后处理敏感信息然后直接重新生成一份新的 pdf
    yiqunz
        6
    yiqunz  
    OP
       69 天前
    @buliugu 具体怎么处理呢?有参考的博客或者用到的技术么?难点在于我没找到这样做的方法。。。
    Jh1n
        7
    Jh1n  
       69 天前
    覆盖然后写入新的内容比如空字符串
    yiqunz
        8
    yiqunz  
    OP
       69 天前
    @Jh1n 没有用的。。贴图片盖住都不行,还是能复制。。能搜索出来
    buliugu
        9
    buliugu  
       68 天前
    @yiqunz 有个 PdfCopy 类可以看一下
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4085 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 03:49 · PVG 11:49 · LAX 19:49 · JFK 22:49
    ♥ Do have faith in what you're doing.