Kiểm thử

OpenClaw có ba bộ Vitest (unit/integration, e2e, live) và một tập nhỏ các runner Docker. Tài liệu này là hướng dẫn “chúng tôi kiểm thử như thế nào”:

Mỗi bộ kiểm thử bao phủ những gì (và cố ý không bao phủ những gì)
Các lệnh cần chạy cho những luồng công việc phổ biến (cục bộ, trước khi push, gỡ lỗi)
Cách test live phát hiện thông tin xác thực và chọn mô hình/nhà cung cấp
Cách thêm hồi quy cho các vấn đề mô hình/nhà cung cấp trong thế giới thực

Khởi động nhanh

Hầu hết các ngày:

Cổng đầy đủ (kỳ vọng trước khi push): pnpm build && pnpm check && pnpm test

Khi bạn chạm vào test hoặc muốn thêm độ tin cậy:

Cổng độ bao phủ: pnpm test:coverage
Bộ E2E: pnpm test:e2e

Khi gỡ lỗi nhà cung cấp/mô hình thực (cần thông tin xác thực thật):

Bộ live (mô hình + probe công cụ/ảnh của gateway): pnpm test:live

Mẹo: khi bạn chỉ cần một ca lỗi, hãy ưu tiên thu hẹp test live bằng các biến môi trường allowlist được mô tả bên dưới.

Các bộ kiểm thử (chạy ở đâu)

Hãy coi các bộ kiểm thử như “mức độ hiện thực tăng dần” (và độ flakiness/chi phí cũng tăng):

Unit / integration (mặc định)

Lệnh: pnpm test
Cấu hình: vitest.config.ts
Tệp: src/**/*.test.ts
Phạm vi:
- Unit test thuần
- Integration test trong tiến trình (xác thực gateway, định tuyến, tooling, parsing, cấu hình)
- Hồi quy mang tính xác định cho các lỗi đã biết
Kỳ vọng:
- Chạy trong CI
- Không cần khóa thật
- Nhanh và ổn định
Lưu ý về pool:
- OpenClaw sử dụng Vitest vmForks trên Node 22/23 để tăng tốc các unit shard.
- Trên Node 24+, OpenClaw tự động chuyển về forks thông thường để tránh lỗi liên kết VM của Node (ERR_VM_MODULE_LINK_FAILURE / module is already linked).
- Ghi đè thủ công bằng OPENCLAW_TEST_VM_FORKS=0 (buộc dùng forks) hoặc OPENCLAW_TEST_VM_FORKS=1 (buộc dùng vmForks).

E2E (gateway smoke)

Lệnh: pnpm test:e2e
Cấu hình: vitest.e2e.config.ts
Tệp: src/**/*.e2e.test.ts
Phạm vi:
- Hành vi end-to-end của gateway đa phiên bản
- Bề mặt WebSocket/HTTP, ghép cặp node và mạng nặng hơn
- Mặc định chạy ở chế độ im lặng để giảm overhead I/O của console.
Kỳ vọng:
- Chạy trong CI (khi được bật trong pipeline)
- Không cần khóa thật
Phạm vi:
- Hành vi end-to-end của gateway đa phiên bản
- Bề mặt WebSocket/HTTP, ghép cặp node và mạng nặng hơn
Kỳ vọng:
- Chạy trong CI (khi được bật trong pipeline)
- Không cần khóa thật
- Nhiều thành phần chuyển động hơn unit test (có thể chậm hơn)

Live (nhà cung cấp thật + mô hình thật)

Lệnh: pnpm test:live
Cấu hình: vitest.live.config.ts
Tệp: src/**/*.live.test.ts
Mặc định: bật bởi pnpm test:live (thiết lập OPENCLAW_LIVE_TEST=1)
Phạm vi:
- “Nhà cung cấp/mô hình này có thực sự hoạt động hôm nay với thông tin xác thực thật không?”
- Bắt thay đổi định dạng của nhà cung cấp, quirks khi gọi công cụ, vấn đề xác thực và hành vi giới hạn tốc độ
Kỳ vọng:
- Không ổn định cho CI theo thiết kế (mạng thật, chính sách nhà cung cấp thật, hạn mức, gián đoạn)
- Tốn tiền / dùng hạn mức
- Ưu tiên chạy các tập con đã thu hẹp thay vì “mọi thứ”
- Các lần chạy live sẽ nạp ~/.profile để lấy các khóa API còn thiếu
- Xoay vòng khóa Anthropic: đặt OPENCLAW_LIVE_ANTHROPIC_KEYS="sk-...,sk-..." (hoặc OPENCLAW_LIVE_ANTHROPIC_KEY=sk-...) hoặc nhiều biến ANTHROPIC_API_KEY*; test sẽ thử lại khi gặp giới hạn tốc độ

Tôi nên chạy bộ nào?

Dùng bảng quyết định này:

Chỉnh sửa logic/test: chạy pnpm test (và pnpm test:coverage nếu bạn thay đổi nhiều)
Chạm vào mạng gateway / giao thức WS / ghép cặp: thêm pnpm test:e2e
Gỡ lỗi “bot của tôi bị down” / lỗi theo nhà cung cấp / gọi công cụ: chạy một pnpm test:live đã thu hẹp

Live: smoke mô hình (profile keys)

Test live được chia thành hai lớp để cô lập lỗi:

“Mô hình trực tiếp” cho biết nhà cung cấp/mô hình có trả lời được với khóa đã cho hay không.
“Gateway smoke” cho biết toàn bộ pipeline gateway+tác tử hoạt động với mô hình đó (phiên, lịch sử, công cụ, chính sách sandbox, v.v.).

Lớp 1: Hoàn thành mô hình trực tiếp (không gateway)

Test: src/agents/models.profiles.live.test.ts
Mục tiêu:
- Liệt kê các mô hình được phát hiện
- Dùng getApiKeyForModel để chọn các mô hình bạn có thông tin xác thực
- Chạy một completion nhỏ cho mỗi mô hình (và các hồi quy nhắm mục tiêu khi cần)
Cách bật:
- pnpm test:live (hoặc OPENCLAW_LIVE_TEST=1 nếu gọi Vitest trực tiếp)
Đặt OPENCLAW_LIVE_MODELS=modern (hoặc all, alias hiện đại) để thực sự chạy bộ này; nếu không nó sẽ bỏ qua để giữ pnpm test:live tập trung vào gateway smoke
Cách chọn mô hình:
- OPENCLAW_LIVE_MODELS=modern để chạy allowlist hiện đại (Opus/Sonnet/Haiku 4.5, GPT-5.x + Codex, Gemini 3, GLM 4.7, MiniMax M2.1, Grok 4)
- OPENCLAW_LIVE_MODELS=all là alias cho allowlist hiện đại
- hoặc OPENCLAW_LIVE_MODELS="openai/gpt-5.2,anthropic/claude-opus-4-6,..." (allowlist dạng dấu phẩy)
Cách chọn nhà cung cấp:
- OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli" (allowlist dạng dấu phẩy)
Nguồn khóa:
- Mặc định: kho profile và fallback biến môi trường
- Đặt OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 để buộc chỉ dùng kho profile
Lý do tồn tại:
- Tách “API nhà cung cấp bị hỏng / khóa không hợp lệ” khỏi “pipeline gateway/tác tử bị hỏng”
- Chứa các hồi quy nhỏ, cô lập (ví dụ: OpenAI Responses/Codex Responses replay suy luận + luồng gọi công cụ)

Lớp 2: Gateway + dev agent smoke (những gì “@openclaw” thực sự làm)

Test: src/gateway/gateway-models.profiles.live.test.ts
Mục tiêu:
- Khởi động gateway trong tiến trình
- Tạo/patch một phiên agent:dev:* (ghi đè mô hình theo từng lần chạy)
- Lặp qua các mô hình có khóa và xác nhận:
  - phản hồi “có ý nghĩa” (không dùng công cụ)
  - một lần gọi công cụ thật hoạt động (probe đọc)
  - các probe công cụ bổ sung tùy chọn (probe exec+read)
  - các đường hồi quy OpenAI (chỉ gọi công cụ → theo dõi) tiếp tục hoạt động
Chi tiết probe (để bạn giải thích lỗi nhanh):
- Probe read: test ghi một tệp nonce trong workspace và yêu cầu tác tử read nó và echo nonce trở lại.
- Probe exec+read: test yêu cầu tác tử exec-ghi một nonce vào tệp tạm, rồi read nó trở lại.
- Probe ảnh: test đính kèm một PNG được tạo (mèo + mã ngẫu nhiên) và kỳ vọng mô hình trả về cat <CODE>.
- Tham chiếu triển khai: src/gateway/gateway-models.profiles.live.test.ts và src/gateway/live-image-probe.ts.
Cách bật:
- pnpm test:live (hoặc OPENCLAW_LIVE_TEST=1 nếu gọi Vitest trực tiếp)
Cách chọn mô hình:
- Mặc định: allowlist hiện đại (Opus/Sonnet/Haiku 4.5, GPT-5.x + Codex, Gemini 3, GLM 4.7, MiniMax M2.1, Grok 4)
- OPENCLAW_LIVE_GATEWAY_MODELS=all là alias cho allowlist hiện đại
- Hoặc đặt OPENCLAW_LIVE_GATEWAY_MODELS="provider/model" (hoặc danh sách dấu phẩy) để thu hẹp
Cách chọn nhà cung cấp (tránh “OpenRouter mọi thứ”):
- OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax" (allowlist dạng dấu phẩy)
Probe công cụ + ảnh luôn bật trong test live này:
- Probe read + probe exec+read (stress công cụ)
- Probe ảnh chạy khi mô hình quảng cáo hỗ trợ đầu vào hình ảnh
- Luồng (mức cao):
  - Test tạo một PNG nhỏ với “CAT” + mã ngẫu nhiên (src/gateway/live-image-probe.ts)
  - Gửi qua agent attachments: [{ mimeType: "image/png", content: "<base64>" }]
  - Gateway phân tích tệp đính kèm thành images[] (src/gateway/server-methods/agent.ts + src/gateway/chat-attachments.ts)
  - Tác tử nhúng chuyển tiếp một thông điệp người dùng đa phương thức tới mô hình
  - Khẳng định: phản hồi chứa cat + mã (dung sai OCR: cho phép sai sót nhỏ)

Mẹo: để xem bạn có thể test gì trên máy của mình (và các id provider/model chính xác), chạy:

openclaw models list
openclaw models list --json

Live: Anthropic setup-token smoke

Test: src/agents/anthropic.setup-token.live.test.ts
Mục tiêu: xác minh setup-token của Claude Code CLI (hoặc profile setup-token được dán) có thể hoàn thành một prompt Anthropic.
Bật:
- pnpm test:live (hoặc OPENCLAW_LIVE_TEST=1 nếu gọi Vitest trực tiếp)
- OPENCLAW_LIVE_SETUP_TOKEN=1
Nguồn token (chọn một):
- Profile: OPENCLAW_LIVE_SETUP_TOKEN_PROFILE=anthropic:setup-token-test
- Token thô: OPENCLAW_LIVE_SETUP_TOKEN_VALUE=sk-ant-oat01-...
Ghi đè mô hình (tùy chọn):
- OPENCLAW_LIVE_SETUP_TOKEN_MODEL=anthropic/claude-opus-4-6

Ví dụ thiết lập:

openclaw models auth paste-token --provider anthropic --profile-id anthropic:setup-token-test
OPENCLAW_LIVE_SETUP_TOKEN=1 OPENCLAW_LIVE_SETUP_TOKEN_PROFILE=anthropic:setup-token-test pnpm test:live src/agents/anthropic.setup-token.live.test.ts

Live: CLI backend smoke (Claude Code CLI hoặc các CLI cục bộ khác)

Test: src/gateway/gateway-cli-backend.live.test.ts
Mục tiêu: xác thực pipeline Gateway + tác tử bằng backend CLI cục bộ, không chạm vào cấu hình mặc định của bạn.
Bật:
- pnpm test:live (hoặc OPENCLAW_LIVE_TEST=1 nếu gọi Vitest trực tiếp)
- OPENCLAW_LIVE_CLI_BACKEND=1
Mặc định:
- Mô hình: claude-cli/claude-sonnet-4-5
- Lệnh: claude
- Tham số: ["-p","--output-format","json","--dangerously-skip-permissions"]
Ghi đè (tùy chọn):
- OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-opus-4-6"
- OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.3-codex"
- OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"
- OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json","--permission-mode","bypassPermissions"]'
- OPENCLAW_LIVE_CLI_BACKEND_CLEAR_ENV='["ANTHROPIC_API_KEY","ANTHROPIC_API_KEY_OLD"]'
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1 để gửi tệp đính kèm ảnh thật (đường dẫn được chèn vào prompt).
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image" để truyền đường dẫn tệp ảnh làm tham số CLI thay vì chèn prompt.
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat" (hoặc "list") để kiểm soát cách truyền tham số ảnh khi IMAGE_ARG được đặt.
- OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1 để gửi lượt thứ hai và xác thực luồng tiếp tục.
OPENCLAW_LIVE_CLI_BACKEND_DISABLE_MCP_CONFIG=0 để giữ cấu hình MCP của Claude Code CLI được bật (mặc định vô hiệu MCP config bằng tệp trống tạm thời).

Ví dụ:

OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-5" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts

Công thức live được khuyến nghị

Allowlist hẹp, tường minh là nhanh nhất và ít flake nhất:

Một mô hình, trực tiếp (không gateway):
- OPENCLAW_LIVE_MODELS="openai/gpt-5.2" pnpm test:live src/agents/models.profiles.live.test.ts
Một mô hình, gateway smoke:
- OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.2" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Gọi công cụ trên nhiều nhà cung cấp:
- OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.2,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,zai/glm-4.7,minimax/minimax-m2.1" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Tập trung Google (khóa API Gemini + Antigravity):
- Gemini (API key): OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
- Antigravity (OAuth): OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

Ghi chú:

google/... dùng Gemini API (API key).
google-antigravity/... dùng cầu nối Antigravity OAuth (endpoint tác tử kiểu Cloud Code Assist).
google-gemini-cli/... dùng Gemini CLI cục bộ trên máy của bạn (xác thực + quirks tooling riêng).
Gemini API vs Gemini CLI:
- API: OpenClaw gọi Gemini API do Google lưu trữ qua HTTP (API key / xác thực profile); đây là điều hầu hết người dùng hiểu khi nói “Gemini”.
- CLI: OpenClaw gọi ra một binary gemini cục bộ; nó có xác thực riêng và có thể hành xử khác (streaming/hỗ trợ công cụ/độ lệch phiên bản).

Live: ma trận mô hình (chúng tôi bao phủ gì)

Không có “danh sách mô hình CI” cố định (live là opt-in), nhưng đây là các mô hình được khuyến nghị để bao phủ thường xuyên trên máy dev có khóa.

Tập smoke hiện đại (gọi công cụ + ảnh)

Đây là lượt chạy “mô hình phổ biến” mà chúng tôi kỳ vọng luôn hoạt động:

OpenAI (không Codex): openai/gpt-5.2 (tùy chọn: openai/gpt-5.1)
OpenAI Codex: openai-codex/gpt-5.3-codex (tùy chọn: openai-codex/gpt-5.3-codex-codex)
Anthropic: anthropic/claude-opus-4-6 (hoặc anthropic/claude-sonnet-4-5)
Google (Gemini API): google/gemini-3-pro-preview và google/gemini-3-flash-preview (tránh Gemini 2.x cũ)
Google (Antigravity): google-antigravity/claude-opus-4-6-thinking và google-antigravity/gemini-3-flash
Z.AI (GLM): zai/glm-4.7
MiniMax: minimax/minimax-m2.1

Chạy gateway smoke với công cụ + ảnh:

OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.2,openai-codex/gpt-5.3-codex,anthropic/claude-opus-4-6,google/gemini-3-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,zai/glm-4.7,minimax/minimax-m2.1" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

Nền tảng: gọi công cụ (Read + Exec tùy chọn)

Chọn ít nhất một cho mỗi họ nhà cung cấp:

OpenAI: openai/gpt-5.2 (hoặc openai/gpt-5-mini)
Anthropic: anthropic/claude-opus-4-6 (hoặc anthropic/claude-sonnet-4-5)
Google: google/gemini-3-flash-preview (hoặc google/gemini-3-pro-preview)
Z.AI (GLM): zai/glm-4.7
MiniMax: minimax/minimax-m2.1

Bao phủ bổ sung tùy chọn (có thì tốt):

xAI: xai/grok-4 (hoặc bản mới nhất)
Cerebras: cerebras/… (chọn một model “tools” mà bạn đã bật)
(nếu bạn có quyền truy cập) LM Studio: lmstudio/…
(cục bộ; việc gọi công cụ phụ thuộc vào chế độ API) (local; tool calling depends on API mode)

Thị giác: gửi ảnh (đính kèm → thông điệp đa phương thức)

Bao gồm ít nhất một model có khả năng xử lý hình ảnh trong OPENCLAW_LIVE_GATEWAY_MODELS (các biến thể Claude/Gemini/OpenAI có vision, v.v.) to exercise the image probe.

Trình tổng hợp / gateway thay thế

Nếu bạn có khóa được bật, chúng tôi cũng hỗ trợ test qua:

OpenRouter: openrouter/... (hàng trăm mô hình; dùng openclaw models scan để tìm ứng viên có tool+image)
OpenCode Zen: opencode/... (xác thực qua OPENCODE_API_KEY / OPENCODE_ZEN_API_KEY)

Các nhà cung cấp khác bạn có thể đưa vào ma trận live (nếu có thông tin xác thực/cấu hình):

Tích hợp sẵn: openai, openai-codex, anthropic, google, google-vertex, google-antigravity, google-gemini-cli, zai, openrouter, opencode, xai, groq, cerebras, mistral, github-copilot
Qua models.providers (endpoint tùy chỉnh): minimax (cloud/API), cùng mọi proxy tương thích OpenAI/Anthropic (LM Studio, vLLM, LiteLLM, v.v.)

Mẹo: đừng cố hardcode “tất cả các model” trong tài liệu. The authoritative list is whatever discoverModels(...) returns on your machine + whatever keys are available.

Thông tin xác thực (không bao giờ commit)

Live tests discover credentials the same way the CLI does. Hệ quả thực tế:

Nếu CLI chạy được, test live sẽ tìm thấy cùng khóa.
Nếu test live báo “không có creds”, hãy gỡ lỗi giống như khi gỡ lỗi openclaw models list / chọn mô hình.
Kho profile: ~/.openclaw/credentials/ (ưu tiên; đây là ý nghĩa của “profile keys” trong test)
Cấu hình: ~/.openclaw/openclaw.json (hoặc OPENCLAW_CONFIG_PATH)

Nếu bạn muốn dựa vào khóa env (ví dụ đã export trong ~/.profile), hãy chạy test cục bộ sau source ~/.profile, hoặc dùng các runner Docker bên dưới (chúng có thể mount ~/.profile vào container).

Deepgram live (chuyển âm thanh thành văn bản)

Test: src/media-understanding/providers/deepgram/audio.live.test.ts
Enable: DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live src/media-understanding/providers/deepgram/audio.live.test.ts

Runner Docker (tùy chọn, kiểm tra “chạy được trên Linux”)

Các runner này chạy pnpm test:live trong image Docker của repo, mount thư mục cấu hình cục bộ và workspace của bạn (và nạp ~/.profile nếu được mount):

Mô hình trực tiếp: pnpm test:docker:live-models (script: scripts/test-live-models-docker.sh)
Gateway + dev agent: pnpm test:docker:live-gateway (script: scripts/test-live-gateway-models-docker.sh)
Trình hướng dẫn onboarding (TTY, scaffolding đầy đủ): pnpm test:docker:onboard (script: scripts/e2e/onboard-docker.sh)
Mạng gateway (hai container, xác thực WS + health): pnpm test:docker:gateway-network (script: scripts/e2e/gateway-network-docker.sh)
Plugin (nạp extension tùy chỉnh + registry smoke): pnpm test:docker:plugins (script: scripts/e2e/plugins-docker.sh)

Biến môi trường hữu ích:

OPENCLAW_CONFIG_DIR=... (mặc định: ~/.openclaw) được mount vào /home/node/.openclaw
OPENCLAW_WORKSPACE_DIR=... (mặc định: ~/.openclaw/workspace) được mount vào /home/node/.openclaw/workspace
OPENCLAW_PROFILE_FILE=... (mặc định: ~/.profile) được mount vào /home/node/.profile và được nạp trước khi chạy test
OPENCLAW_LIVE_GATEWAY_MODELS=... / OPENCLAW_LIVE_MODELS=... để thu hẹp lượt chạy
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 để đảm bảo creds đến từ kho profile (không phải env)

Kiểm tra độ lành mạnh của tài liệu

Chạy kiểm tra tài liệu sau khi chỉnh sửa: pnpm docs:list.

Hồi quy offline (an toàn cho CI)

Đây là các hồi quy “pipeline thật” nhưng không dùng nhà cung cấp thật:

Gọi công cụ gateway (mock OpenAI, gateway + vòng lặp tác tử thật): src/gateway/gateway.tool-calling.mock-openai.test.ts
Trình hướng dẫn gateway (WS wizard.start/wizard.next, ghi cấu hình + ép buộc xác thực): src/gateway/gateway.wizard.e2e.test.ts

Đánh giá độ tin cậy của tác tử (skills)

Chúng tôi đã có một số test an toàn cho CI hoạt động như “đánh giá độ tin cậy của tác tử”:

Mock gọi công cụ qua gateway + vòng lặp tác tử thật (src/gateway/gateway.tool-calling.mock-openai.test.ts).
Luồng wizard end-to-end xác thực wiring phiên và hiệu ứng cấu hình (src/gateway/gateway.wizard.e2e.test.ts).

Những gì còn thiếu cho skills (xem Skills):

Ra quyết định: khi skills được liệt kê trong prompt, tác tử có chọn đúng skill (hoặc tránh skill không liên quan) không?
Tuân thủ: tác tử có đọc SKILL.md trước khi dùng và làm theo các bước/tham số bắt buộc không?
Hợp đồng quy trình: kịch bản nhiều lượt xác nhận thứ tự công cụ, kế thừa lịch sử phiên và ranh giới sandbox.

Các đánh giá tương lai nên ưu tiên tính xác định trước:

Một runner kịch bản dùng nhà cung cấp mock để xác nhận gọi công cụ + thứ tự, đọc tệp skill và wiring phiên.
Một bộ nhỏ các kịch bản tập trung vào skill (dùng vs tránh, gating, prompt injection).
Đánh giá live tùy chọn (opt-in, khóa bởi env) chỉ sau khi bộ an toàn cho CI đã sẵn sàng.

Thêm hồi quy (hướng dẫn)

Khi bạn sửa một vấn đề nhà cung cấp/mô hình được phát hiện trong live:

Thêm một hồi quy an toàn cho CI nếu có thể (mock/stub nhà cung cấp, hoặc ghi lại chính xác biến đổi hình dạng request)
Nếu bản chất là chỉ-live (giới hạn tốc độ, chính sách xác thực), hãy giữ test live hẹp và opt-in qua biến env
Ưu tiên nhắm vào lớp nhỏ nhất bắt được bug:
- lỗi chuyển đổi/replay request của nhà cung cấp → test mô hình trực tiếp
- lỗi pipeline phiên/lịch sử/công cụ của gateway → gateway live smoke hoặc test mock gateway an toàn cho CI

​Kiểm thử

​Khởi động nhanh

​Các bộ kiểm thử (chạy ở đâu)

​Unit / integration (mặc định)

​E2E (gateway smoke)

​Live (nhà cung cấp thật + mô hình thật)

​Tôi nên chạy bộ nào?

​Live: smoke mô hình (profile keys)

​Lớp 1: Hoàn thành mô hình trực tiếp (không gateway)

​Lớp 2: Gateway + dev agent smoke (những gì “@openclaw” thực sự làm)

​Live: Anthropic setup-token smoke

​Live: CLI backend smoke (Claude Code CLI hoặc các CLI cục bộ khác)

​Công thức live được khuyến nghị

​Live: ma trận mô hình (chúng tôi bao phủ gì)

​Tập smoke hiện đại (gọi công cụ + ảnh)

​Nền tảng: gọi công cụ (Read + Exec tùy chọn)

​Thị giác: gửi ảnh (đính kèm → thông điệp đa phương thức)

​Trình tổng hợp / gateway thay thế

​Thông tin xác thực (không bao giờ commit)

​Deepgram live (chuyển âm thanh thành văn bản)

​Runner Docker (tùy chọn, kiểm tra “chạy được trên Linux”)

​Kiểm tra độ lành mạnh của tài liệu

​Hồi quy offline (an toàn cho CI)

​Đánh giá độ tin cậy của tác tử (skills)

​Thêm hồi quy (hướng dẫn)