nijux

nijux

V2EX 第 7545 号会员,加入于 2011-04-01 17:27:41 +08:00
今日活跃度排名 2132
根据 nijux 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
nijux 最近回复了
13 小时 4 分钟前
回复了 Livid 创建的主题 OpenAI GPT-5.4 Thinking 依然过不了洗车测试
如果直接问也是回复说走路

换了下提示词结果对了


省略的内容。。。
[最终执行动作]:
直接开车过去洗车。 🚗



这个提示词就像奇异博士在脑海中构想未来的各种可能性然后选择最优的


我的提示词
-------------------------------------------------------------------------------------

[角色设定]
你是一个具备强大“长期规划( Long-Horizon Planning )”能力的决策智能体。你的目标是在复杂的环境中,通过深思熟虑的推演来选择行动,从而最大化最终的长期收益,并成功完成目标。
[核心原则]
你必须绝对避免“短视( Myopia )”——不要仅仅因为某个动作在当前看似合理(局部最优)就盲目选择它。许多局部最优的动作是“陷阱”,会导致未来陷入死胡同或次优路径。你必须思考未来的延迟后果。
[决策流程]
在面对当前状态( State )需要做出决策时,你必须严格按照以下五个步骤进行思考并输出内容:
步骤 1:提出备选动作与剪枝( Action Proposal & Pruning )
分析当前状态,列出最多 $k$ 个(例如 3-5 个)最有希望的、可行的候选动作。过滤掉明显无关的动作以节省计算资源。
步骤 2:显式前瞻推演( Explicit Lookahead )
不要急于决定。对于步骤 1 中的每一个候选动作,在你的脑海中进行“如果我这样做了,接下来会发生什么”的轨迹模拟。请向未来推演 $H$ 步(例如 2-3 步),构想出多条可能的未来轨迹( Future Trajectories )。
步骤 3:轨迹级全局评估( Trajectory-Level Evaluation )
不要基于当前的局部奖励来打分,而是要基于你推演出的“完整轨迹后果”来评估。问自己:
这条轨迹最终是否能引导我走向最终目标?
这条路径在未来是否会遇到无法克服的死胡同(死局)?
步骤 4:价值回传( Value Propagation )
将步骤 3 中对未来轨迹的评估结果(长期价值),反向回传( Back-propagate )给步骤 1 中对应的那个初始候选动作。如果一个动作当前看起来一般,但能通向极佳的未来,请提高它的评分;如果一个动作当前极具吸引力,但未来是死路,请将其评分降至最低。
步骤 5:有限承诺与单步执行( Limited Commitment )
根据回传后的最终价值,选择出当前最优的一个动作。注意:你只需要输出并承诺执行这一个动作,不要输出完整的计划序列。因为环境可能存在变数,你需要在执行这一步并获得环境的新反馈后,进行滚动视野( Receding-horizon )的重新规划。
[输出格式要求]
[当前状态分析]:...
[备选动作]:1... 2... 3...
[前瞻推演与评估]:
动作 1 的未来轨迹推演及长期评估:...
动作 2 的未来轨迹推演及长期评估:...
动作 3 的未来轨迹推演及长期评估:...
[价值回传与决策]:综合未来后果,动作 X 是最佳选择,因为...
[最终执行动作]:<仅输出你要执行的下一步动作>

-------------------------------------------------------------------------------------

提示词来源于 youtube 博主讲到的某篇论文让 NotebookLM 总结的

这个回复我的自动选择,没用到最新的模型

刚刚换了 5.4 专业版又试了一下,给出了可能更优的解

就是去洗车,经常会遇到洗车的地方排队,去了可能要等排好久他也考虑到了

-------------------------------------------------------------------------------------
[现状分析] :你想洗车,洗车场离你只有 50 米。目标不仅是你到达洗车场,车也必须停在那里。

[候选操作] :1. 步行前往洗车场。2. 开车前往洗车场。3. 先步行前往查看是否有空位,然后再开车过去。

[前瞻与评估] :
行动 1 的未来轨迹和长期评估:你到达了洗车场,但车没到。除非之后有人把车送来,否则主要目标未能实现。糟糕的选择。

行动方案二:未来发展轨迹及长期评估:车辆立即到达洗车场,即可立即洗车。这种方式以最小的阻力直接达成目标,是最佳选择。

行动 3:未来轨迹和长期评估:如果您想检查线路是否存在或线路是否畅通,这可能略有帮助,但对于仅 50 米的距离来说,这会增加一个不必要的步骤。合理,但并非最佳方案。

[价值传播与决策] :考虑到全部结果,行动 2 是最佳选择,因为它是唯一能直接将汽车送到需要清洗的地方的行动。
--------------------------------------------------------------------------------------

说实话现实生活中我是直接打电话给洗车店问下是否空闲,空闲立即开车过去,因为车不是非洗不可,可以选择最省时间的方式
2 月 24 日
回复了 extrem 创建的主题 程序员 求推荐大手人体工学鼠标
推荐绿联( UGREEN )带护腕的鼠标垫子,可以环节手腕的压力

可以试试 pencil 和 claude 结合使用,pencil 生成的内容通过 git 管理
2 月 22 日
回复了 resten 创建的主题 VPS 请教一下稳定的 VPS 推荐。
https://www.misaka.io/speedtest/mc2 可以自己测试一下看一下 ping ,要选线路优化 (WAN Latency Optimized) 或者 (CN2)的,之前稳定用过几年
Berlin
Los Angeles
Tokyo
Singapore
Hong Kong 延迟最低但是买完了
2 月 17 日
回复了 SayHelloHi 创建的主题 问与答 闪电说是用 Rust 开发的吗?
局域网用单独的内部域名部署 CLIProxyAPI 做转发
2 月 11 日
回复了 duffercn 创建的主题 路由器 2026,求推荐一个无线路由器
2 月 11 日
回复了 duffercn 创建的主题 路由器 2026,求推荐一个无线路由器
https://www.acwifi.net/ 可以参考下拆机 看下做工
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2848 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 08:58 · PVG 16:58 · LAX 00:58 · JFK 03:58
♥ Do have faith in what you're doing.