Token 使用量與成本
OpenClaw tracks tokens, not characters. Tokens 與模型相關,但多數 OpenAI 風格的模型在英文文本中平均約每個 token 對應 ~4 個字元。系統提示如何建構
OpenClaw 在每次執行時都會組裝自己的系統提示。內容包含: 它包含: 它包含:- 工具清單 + 簡短說明
- Skills 清單(僅中繼資料;指示會在需要時透過
read載入) - 自我更新指示
- 工作區 + 啟動檔案(
AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md、BOOTSTRAP.md於新增時)。大型檔案會由agents.defaults.bootstrapMaxChars截斷(預設:20000)。 大型檔案會被agents.defaults.bootstrapMaxChars截斷(預設:20000)。 大型檔案會依agents.defaults.bootstrapMaxChars(預設:20000)截斷,且 bootstrap 注入的總字元數上限為agents.defaults.bootstrapTotalMaxChars(預設:24000)。memory/*.md檔案透過 memory 工具按需載入,不會自動注入。 - 時間(UTC + 使用者時區)
- 回覆標籤 + 心跳行為
- 執行期中繼資料(host/OS/model/thinking)
哪些內容會計入上下文視窗
模型接收的一切都會計入內容限制:- 系統提示(上述所有章節)
- 對話歷史(使用者 + 助手訊息)
- 工具呼叫與工具結果
- 附件/逐字稿(圖片、音訊、檔案)
- 壓縮摘要與修剪產物
- 提供者包裝或安全標頭(不可見,但仍會計入)
/context list 或 /context detail。 請參閱 Context。
如何查看目前的權杖使用量
在聊天中使用以下指令:/status→ 表情符號豐富的狀態卡,顯示工作階段模型、內容使用量、 上一次回覆的輸入/輸出權杖,以及 預估成本(僅限 API 金鑰)。/usage off|tokens|full→ 將 逐回覆使用量頁尾 附加到每則回覆。- 每個工作階段皆會持久化(儲存為
responseUsage)。 - OAuth 驗證 隱藏成本(僅顯示權杖)。
- 每個工作階段皆會持久化(儲存為
/usage cost→ 顯示來自 OpenClaw 工作階段記錄的本機成本摘要。
- TUI/Web TUI: 支援
/status+/usage。 - CLI:
openclaw status --usage與openclaw channels list會顯示 提供者配額視窗(非逐回覆成本)。
成本估算(顯示時)
成本會依你的模型定價設定估算:input、output、cacheRead 與
cacheWrite 的 每 100 萬 tokens(USD) 價格。 如果缺少價格,OpenClaw 只會顯示 token 數量。 OAuth tokens
不會顯示美元成本。
快取 TTL 與修剪影響
供應商的提示快取僅在快取 TTL 視窗內適用。 OpenClaw 可以 選擇性地執行 cache-ttl 修剪:當快取 TTL 到期後修剪該工作階段,接著重設快取視窗,讓後續請求能重用新近快取的上下文,而不必重新快取完整歷史。 當工作階段在 TTL 之後進入閒置狀態時,這能降低快取寫入成本。 請在 Gateway 設定 中設定,並於 Session pruning 查看行為細節。 Heartbeat 可在閒置間隔期間讓快取保持 warm。 Heartbeat 可在閒置間隔期間讓快取保持 warm。 心跳可在閒置間隔中讓快取保持 溫熱。若你的模型快取 TTL 為1h,
將心跳間隔設在略低於該值(例如 55m)即可避免
重新快取完整提示,降低快取寫入成本。
就 Anthropic API 定價而言,快取讀取的成本顯著低於輸入 tokens,而快取寫入則以較高的乘數計費。 對於 Anthropic API 定價,快取讀取的成本顯著低於輸入權杖,
而快取寫入則以較高倍數計費。最新費率與 TTL 倍數請參閱 Anthropic 的提示快取定價:
https://docs.anthropic.com/docs/build-with-claude/prompt-caching
範例:以心跳維持 1 小時快取溫熱
降低 token 壓力的技巧
- 使用
/compact來摘要冗長的工作階段。 - 在工作流程中修剪大型工具輸出。
- 保持技能描述精簡(技能清單會被注入提示)。
- 在冗長、探索性的工作中優先選擇較小的模型。