账单明细FAQ

为什么我只发了一条消息，账单里却有多条记录？

这是正常现象。很多 Agent 客户端并不是"一条用户消息 = 一次模型请求"。

例如 Claude CLI、Codex Desktop 这类 Agent 工具，在完成一个任务时，可能会连续发起多轮模型请求：理解需求、读取上下文、调用工具、总结结果、继续规划下一步。

此外，有些客户端还会在你没有明确发送新消息时，自动发起一些辅助请求，例如：

账单明细展示的是底层真实模型请求，所以你可能会看到同一时间附近出现多条记录。

你看到的是一次操作或一次对话，系统记录的是背后所有真实发生的模型调用。

Agent 工具可能会把一个任务拆成多个步骤，不同步骤使用不同模型。例如一个步骤用更强模型做规划，另一个步骤用更轻量模型处理简单内容。

所以同一轮任务中出现多个模型，不一定代表异常，而是 Agent 客户端在按步骤调用不同模型。

Cache 是模型服务的上下文缓存机制。Agent 在连续多轮任务中，经常会重复携带大量上下文，例如项目文件、历史对话、工具结果等。

所以你可能会看到某些记录的 Cache 写入很多、费用较高；另一些记录 Cache 读取很多、费用较低。这通常说明 Agent 在复用上下文缓存。

因为模型计费不只看普通输入和输出 Tokens，还可能包含 Cache 写入、Cache 读取、模型单价差异等因素。

尤其是 Claude / Agent 场景中，大量费用可能来自上下文缓存，而不是你本次手动输入的那几句话。

"应扣金额"可以理解为按模型官方或标准价格计算的参考金额；"实扣金额"是 TeamoRouter 按当前折扣后实际从余额中扣除的金额。

如果页面显示 "2.8折""6折""1.1折" 等标签，表示本次请求享受了对应折扣。

如果你遇到以下情况，可以联系我们排查：

请进群添加客服，尽量提供请求时间、模型名称、来源和截图，方便我们快速定位。