跳轉到主要內容

Token 使用量與成本

OpenClaw tracks tokens, not characters. Tokens 與模型相關,但多數 OpenAI 風格的模型在英文文本中平均約每個 token 對應 ~4 個字元。

系統提示如何建構

OpenClaw 在每次執行時都會組裝自己的系統提示。內容包含: 它包含: 它包含:
  • 工具清單 + 簡短說明
  • Skills 清單(僅中繼資料;指示會在需要時透過 read 載入)
  • 自我更新指示
  • 工作區 + 啟動檔案(AGENTS.mdSOUL.mdTOOLS.mdIDENTITY.mdUSER.mdHEARTBEAT.mdBOOTSTRAP.md 於新增時)。大型檔案會由 agents.defaults.bootstrapMaxChars 截斷(預設:20000)。 大型檔案會被 agents.defaults.bootstrapMaxChars 截斷(預設:20000)。 大型檔案會依 agents.defaults.bootstrapMaxChars(預設:20000)截斷,且 bootstrap 注入的總字元數上限為 agents.defaults.bootstrapTotalMaxChars(預設:24000)。 memory/*.md 檔案透過 memory 工具按需載入,不會自動注入。
  • 時間(UTC + 使用者時區)
  • 回覆標籤 + 心跳行為
  • 執行期中繼資料(host/OS/model/thinking)
請參閱 System Prompt 以查看完整拆解。

哪些內容會計入上下文視窗

模型接收的一切都會計入內容限制:
  • 系統提示(上述所有章節)
  • 對話歷史(使用者 + 助手訊息)
  • 工具呼叫與工具結果
  • 附件/逐字稿(圖片、音訊、檔案)
  • 壓縮摘要與修剪產物
  • 提供者包裝或安全標頭(不可見,但仍會計入)
若要實際的拆解(每個注入檔案、工具、技能,以及系統提示大小),請使用 /context list/context detail。 請參閱 Context

如何查看目前的權杖使用量

在聊天中使用以下指令:
  • /status表情符號豐富的狀態卡,顯示工作階段模型、內容使用量、 上一次回覆的輸入/輸出權杖,以及 預估成本(僅限 API 金鑰)。
  • /usage off|tokens|full → 將 逐回覆使用量頁尾 附加到每則回覆。
    • 每個工作階段皆會持久化(儲存為 responseUsage)。
    • OAuth 驗證 隱藏成本(僅顯示權杖)。
  • /usage cost → 顯示來自 OpenClaw 工作階段記錄的本機成本摘要。
其他介面:
  • TUI/Web TUI: 支援 /status + /usage
  • CLI: openclaw status --usageopenclaw channels list 會顯示 提供者配額視窗(非逐回覆成本)。

成本估算(顯示時)

成本會依你的模型定價設定估算:
models.providers.<provider>.models[].cost
以下為 inputoutputcacheReadcacheWrite每 100 萬 tokens(USD) 價格。 如果缺少價格,OpenClaw 只會顯示 token 數量。 OAuth tokens 不會顯示美元成本。

快取 TTL 與修剪影響

供應商的提示快取僅在快取 TTL 視窗內適用。 OpenClaw 可以 選擇性地執行 cache-ttl 修剪:當快取 TTL 到期後修剪該工作階段,接著重設快取視窗,讓後續請求能重用新近快取的上下文,而不必重新快取完整歷史。 當工作階段在 TTL 之後進入閒置狀態時,這能降低快取寫入成本。 請在 Gateway 設定 中設定,並於 Session pruning 查看行為細節。 Heartbeat 可在閒置間隔期間讓快取保持 warm。 Heartbeat 可在閒置間隔期間讓快取保持 warm。 心跳可在閒置間隔中讓快取保持 溫熱。若你的模型快取 TTL 為 1h, 將心跳間隔設在略低於該值(例如 55m)即可避免 重新快取完整提示,降低快取寫入成本。 就 Anthropic API 定價而言,快取讀取的成本顯著低於輸入 tokens,而快取寫入則以較高的乘數計費。 對於 Anthropic API 定價,快取讀取的成本顯著低於輸入權杖, 而快取寫入則以較高倍數計費。最新費率與 TTL 倍數請參閱 Anthropic 的提示快取定價: https://docs.anthropic.com/docs/build-with-claude/prompt-caching

範例:以心跳維持 1 小時快取溫熱

agents:
  defaults:
    model:
      primary: "anthropic/claude-opus-4-6"
    models:
      "anthropic/claude-opus-4-6":
        params:
          cacheRetention: "long"
    heartbeat:
      every: "55m"

降低 token 壓力的技巧

  • 使用 /compact 來摘要冗長的工作階段。
  • 在工作流程中修剪大型工具輸出。
  • 保持技能描述精簡(技能清單會被注入提示)。
  • 在冗長、探索性的工作中優先選擇較小的模型。
請參閱 Skills 以了解精確的技能清單額外負擔公式。