Token 使用量與成本

OpenClaw tracks tokens, not characters. Tokens 與模型相關，但多數 OpenAI 風格的模型在英文文本中平均約每個 token 對應 ~4 個字元。

系統提示如何建構

OpenClaw 在每次執行時都會組裝自己的系統提示。內容包含：它包含：它包含：

工具清單 + 簡短說明
Skills 清單（僅中繼資料；指示會在需要時透過 read 載入）
自我更新指示
工作區 + 啟動檔案（AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md、BOOTSTRAP.md 於新增時）。大型檔案會由 agents.defaults.bootstrapMaxChars 截斷（預設：20000）。大型檔案會被 agents.defaults.bootstrapMaxChars 截斷（預設：20000）。大型檔案會依 agents.defaults.bootstrapMaxChars（預設：20000）截斷，且 bootstrap 注入的總字元數上限為 agents.defaults.bootstrapTotalMaxChars（預設：24000）。 memory/*.md 檔案透過 memory 工具按需載入，不會自動注入。
時間（UTC + 使用者時區）
回覆標籤 + 心跳行為
執行期中繼資料（host/OS/model/thinking）

請參閱 System Prompt 以查看完整拆解。

哪些內容會計入上下文視窗

模型接收的一切都會計入內容限制：

系統提示（上述所有章節）
對話歷史（使用者 + 助手訊息）
工具呼叫與工具結果
附件／逐字稿（圖片、音訊、檔案）
壓縮摘要與修剪產物
提供者包裝或安全標頭（不可見，但仍會計入）

若要實際的拆解（每個注入檔案、工具、技能，以及系統提示大小），請使用 /context list 或 /context detail。請參閱 Context。

如何查看目前的權杖使用量

在聊天中使用以下指令：

/status → 表情符號豐富的狀態卡，顯示工作階段模型、內容使用量、上一次回覆的輸入／輸出權杖，以及 預估成本（僅限 API 金鑰）。
/usage off|tokens|full → 將 逐回覆使用量頁尾 附加到每則回覆。
- 每個工作階段皆會持久化（儲存為 responseUsage）。
- OAuth 驗證 隱藏成本（僅顯示權杖）。
/usage cost → 顯示來自 OpenClaw 工作階段記錄的本機成本摘要。

其他介面：

TUI／Web TUI： 支援 /status + /usage。
CLI： openclaw status --usage 與 openclaw channels list 會顯示提供者配額視窗（非逐回覆成本）。

成本估算（顯示時）

成本會依你的模型定價設定估算：

models.providers.<provider>.models[].cost

以下為 input、output、cacheRead 與 cacheWrite 的 每 100 萬 tokens（USD） 價格。如果缺少價格，OpenClaw 只會顯示 token 數量。 OAuth tokens 不會顯示美元成本。

快取 TTL 與修剪影響

供應商的提示快取僅在快取 TTL 視窗內適用。 OpenClaw 可以選擇性地執行 cache-ttl 修剪：當快取 TTL 到期後修剪該工作階段，接著重設快取視窗，讓後續請求能重用新近快取的上下文，而不必重新快取完整歷史。當工作階段在 TTL 之後進入閒置狀態時，這能降低快取寫入成本。請在 Gateway 設定中設定，並於 Session pruning 查看行為細節。 Heartbeat 可在閒置間隔期間讓快取保持 warm。 Heartbeat 可在閒置間隔期間讓快取保持 warm。心跳可在閒置間隔中讓快取保持溫熱。若你的模型快取 TTL 為 1h，將心跳間隔設在略低於該值（例如 55m）即可避免重新快取完整提示，降低快取寫入成本。就 Anthropic API 定價而言，快取讀取的成本顯著低於輸入 tokens，而快取寫入則以較高的乘數計費。對於 Anthropic API 定價，快取讀取的成本顯著低於輸入權杖，而快取寫入則以較高倍數計費。最新費率與 TTL 倍數請參閱 Anthropic 的提示快取定價： https://docs.anthropic.com/docs/build-with-claude/prompt-caching

範例：以心跳維持 1 小時快取溫熱

agents:
  defaults:
    model:
      primary: "anthropic/claude-opus-4-6"
    models:
      "anthropic/claude-opus-4-6":
        params:
          cacheRetention: "long"
    heartbeat:
      every: "55m"

降低 token 壓力的技巧

使用 /compact 來摘要冗長的工作階段。
在工作流程中修剪大型工具輸出。
保持技能描述精簡（技能清單會被注入提示）。
在冗長、探索性的工作中優先選擇較小的模型。

請參閱 Skills 以了解精確的技能清單額外負擔公式。

CLI 指令

RPC 與 API

範本

技術參考

概念內部機制

專案

版本說明

實驗

Token Use and Costs

Token 使用量與成本

系統提示如何建構

哪些內容會計入上下文視窗

如何查看目前的權杖使用量

成本估算（顯示時）

快取 TTL 與修剪影響

範例：以心跳維持 1 小時快取溫熱

降低 token 壓力的技巧

​Token 使用量與成本

​系統提示如何建構

​哪些內容會計入上下文視窗

​如何查看目前的權杖使用量

​成本估算（顯示時）

​快取 TTL 與修剪影響

​範例：以心跳維持 1 小時快取溫熱

​降低 token 壓力的技巧

Token 使用量與成本

系統提示如何建構

哪些內容會計入上下文視窗

如何查看目前的權杖使用量

成本估算（顯示時）

快取 TTL 與修剪影響

範例：以心跳維持 1 小時快取溫熱

降低 token 壓力的技巧