做了个中转站检测工具，测了我自己建的站，有 1 项未通过

团队做了个工具叫 Probe ，用来检测 AI API 中转站到底有没有按你买的模型给你跑。昨天拿一个我自己搭建的站测了下——thinkai.tv ，9 大类检测里 8 项 PASS ，Identity & Routing 这一项是 FAIL 。

做这个工具的起因是这样：现在国内用 AI API ，因为访问、价格、额度、支付方式，大部分人都在用中转站。中转站确实解决了"能不能用"的问题，但有个更隐蔽的问题。你不知道这个接口是不是把你的请求原样转发给上游模型，还是中间动了手脚。

中转站理论上能看到明文请求和响应，包括 system prompt 、用户输入、API key 、tool call 参数、文件内容。它也不一定只是"转发"，可能在中间偷偷做这些事：

用便宜模型冒充高价模型
截断长上下文但仍按正常方式收费
伪造流式输出或 usage 字段
改写 tool call 参数：安装命令、URL 、钱包地址、云凭据

实测 thinkai.tv ，9 大类里 8 项 PASS ，Identity & Routing FAIL 。

回到 thinkai.tv 这次的实测。我测的是 claude-opus-4-6 。Match rate 48/49——说明它确实连到了真的 Claude Opus 4.6 ，不是套壳模型。提示词、护栏、工具调用、计费这些都没被改坏，这是它的基本盘。

FAIL 的是 Identity & Routing：请求经过了 2 个代理家族（ OneAPI + Via ）的串联，不是直连 Anthropic 。意味着我的 system prompt 和 tool call 在中间多停了两站，延迟和隐私边界都涨了。其他数据：Avg TTFT 1.839s ，吞吐量 16.82 tok/s ，输入 153505 token 、输出 6704 token 。一次完整检测 3-5 分钟，烧了大概 0.5 美元 API 费。

以前判断一个中转站可不可信，常见做法是：

看响应速度
看价格 / 额度
看群里口碑、博客推荐
试用几次能用就接着用

但这些方法都不能验证一件事：你的请求到底有没有原样转发给上游模型。

之前在 X 上爆火过一篇论文 Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain （ arXiv:2604.08407v1 ），研究者测了 28 个付费路由和 400 个免费路由，发现 1 个付费路由和 8 个免费路由有主动注入恶意代码的行为。还有路由会触碰研究者埋的 AWS 凭据，甚至有 ETH 私钥被转走的真实案例。

光看响应速度和价格是测不出来的。

正确的方法是直接对接口做行为级检测：发不同特征的探针，看返回是不是真从你买的那个模型来的。Probe 跑的是这 9 大类：