如何避免露出 prompt 给用户

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

This topic created in 423 days ago, the information mentioned may be changed or developed.

尤其是用 deepseek 的思考过程的时候。由于可能在输入中注入了一些用户画像/行为的数据，但又不想让用户看到思考过程中的 prompt （比如行为习惯/抓到的私密信息等），怎样才能利用这些信息的同时不展示给用户呢？

7 replies • 2025-03-08 15:18:15 +08:00

foolishcrab

Mar 4, 2025 via iPhone

system 里定义好允许回答的问题，
关键词过滤一下用户输入，
用次一级 turbo flash 模型判断一下用户输入是否有恶意

so1n

Mar 4, 2025

做输出检查，或者做多 agent ，核心的 agent 后置，就看不到 prompt 了

ohazyi

Mar 4, 2025

@foolishcrab 不懂就问，一级 turbo flash 模型是什么？

foolishcrab

Mar 4, 2025 via iPhone

@ohazyi 次一级啊，就又便宜又快的模型

ohazyi

Mar 8, 2025

哦哦哦。但是我的问题本质不是害怕用户套 prompt ，而是现在我自己的 prompt 就很长，thinking 几乎 100%会暴露一些敏感信息

ohazyi

Mar 8, 2025

@so1n 现在是流式的，不能实时检查诶

so1n

Mar 8, 2025

@ohazyi #6 你可以弄个拦截器把流式的东西拼接起来再检查啊，只是需要多检查几次比较麻烦而已