账单明细FAQ

为什么我只发了一条消息,账单里却有多条记录?

这是正常现象。很多 Agent 客户端并不是"一条用户消息 = 一次模型请求"。

例如 Claude CLI、Codex Desktop 这类 Agent 工具,在完成一个任务时,可能会连续发起多轮模型请求:理解需求、读取上下文、调用工具、总结结果、继续规划下一步。

此外,有些客户端还会在你没有明确发送新消息时,自动发起一些辅助请求,例如:

  • 生成首页推荐内容
  • 加载或总结上下文
  • 检查当前会话状态
  • 为下一步操作做预处理

账单明细展示的是底层真实模型请求,所以你可能会看到同一时间附近出现多条记录。

你看到的是一次操作或一次对话,系统记录的是背后所有真实发生的模型调用。

为什么模型选择 gpt-5.5,但是账单中出现了 gpt-5.4-mini?

Agent 工具可能会把一个任务拆成多个步骤,不同步骤使用不同模型。例如一个步骤用更强模型做规划,另一个步骤用更轻量模型处理简单内容。

所以同一轮任务中出现多个模型,不一定代表异常,而是 Agent 客户端在按步骤调用不同模型。

Cache 读取和 Cache 写入是什么?为什么金额差异很大?

Cache 是模型服务的上下文缓存机制。Agent 在连续多轮任务中,经常会重复携带大量上下文,例如项目文件、历史对话、工具结果等。

  • Cache 写入:首次把上下文写入缓存,通常费用较高。
  • Cache 读取:后续复用已缓存上下文,通常比重新输入便宜很多。

所以你可能会看到某些记录的 Cache 写入很多、费用较高;另一些记录 Cache 读取很多、费用较低。这通常说明 Agent 在复用上下文缓存。

为什么有些请求输入 Tokens 很少,但费用不低?

因为模型计费不只看普通输入和输出 Tokens,还可能包含 Cache 写入、Cache 读取、模型单价差异等因素。

尤其是 Claude / Agent 场景中,大量费用可能来自上下文缓存,而不是你本次手动输入的那几句话。

为什么应扣金额和实扣金额不一样?

"应扣金额"可以理解为按模型官方或标准价格计算的参考金额;"实扣金额"是 TeamoRouter 按当前折扣后实际从余额中扣除的金额。

如果页面显示 "2.8折""6折""1.1折" 等标签,表示本次请求享受了对应折扣。

什么时候需要联系客服?

如果你遇到以下情况,可以联系我们排查:

  • 明显没有发起任务,但账单持续产生记录。
  • 短时间内多次重复 Cache 写入,并且没有 Cache 读取。
  • 同一请求出现异常大量重复扣费。
  • 账单模型与你的使用场景完全不符。
  • 实扣金额明显异常。
  • Agent 调用失败,但仍产生了无法理解的扣费记录。

请进群添加客服,尽量提供请求时间、模型名称、来源和截图,方便我们快速定位。

微信扫码加入交流群

遇到问题?

微信扫码加入交流群

账单明细FAQ · 帮助文档