流式传输 + 分块

OpenClaw 有两个独立的”流式传输”层：

分块流式传输（渠道）： 在助手写入时发出已完成的块。这些是普通的渠道消息（不是令牌增量）。 These are normal channel messages (not token deltas).
类令牌流式传输（仅限 Telegram）： 在生成时用部分文本更新草稿气泡；最终消息在结束时发送。

目前尚未实现真正的 token-delta 流式传输到频道消息。 Telegram 预览流式传输是唯一的部分流式界面。

分块流式传输（渠道消息）

分块流式传输在助手输出可用时以粗粒度块发送。

模型输出
  └─ text_delta/events
       ├─ (blockStreamingBreak=text_end)
       │    └─ 分块器在缓冲区增长时发出块
       └─ (blockStreamingBreak=message_end)
            └─ 分块器在 message_end 时刷新
                   └─ 渠道发送（块回复）

Legend:

text_delta/events：模型流事件（对于非流式模型可能稀疏）。
chunker：应用最小/最大边界 + 断点偏好的 EmbeddedBlockChunker。
channel send：实际的出站消息（块回复）。

控制项：

agents.defaults.blockStreamingDefault："on"/"off"（默认关闭）。
渠道覆盖：*.blockStreaming（以及每账户变体）可为每个渠道强制设置 "on"/"off"。
agents.defaults.blockStreamingBreak："text_end" 或 "message_end"。
agents.defaults.blockStreamingChunk：{ minChars, maxChars, breakPreference? }。
agents.defaults.blockStreamingCoalesce：{ minChars?, maxChars?, idleMs? }（发送前合并流式块）。
渠道硬上限：*.textChunkLimit（例如 channels.whatsapp.textChunkLimit）。
渠道分块模式：*.chunkMode（默认 length，newline 在长度分块之前按空行（段落边界）分割）。
Discord 软上限：channels.discord.maxLinesPerMessage（默认 17）分割高度较大的回复以避免 UI 裁剪。

边界语义：

text_end：分块器发出时立即流式传输块；在每个 text_end 时刷新。
message_end：等到助手消息完成，然后刷新缓冲的输出。

如果缓冲文本超过 maxChars，message_end 仍然使用分块器，因此可能在最后发出多个块。

分块算法（低/高边界）

块分块由 EmbeddedBlockChunker 实现：

低边界： 在缓冲区 >= minChars 之前不发出（除非强制）。
高边界： 优先在 maxChars 之前分割；如果强制，则在 maxChars 处分割。
断点偏好： paragraph → newline → sentence → whitespace → 硬断点。
代码围栏： 从不在围栏内分割；当在 maxChars 处强制分割时，关闭 + 重新打开围栏以保持 Markdown 有效。

maxChars 被限制在渠道 textChunkLimit 内，因此你无法超过每渠道的上限。

合并（合并流式块）

启用分块流式传输时，OpenClaw 可以在发送前合并连续的块分块。这减少了”单行刷屏”，同时仍提供渐进式输出。 This reduces “single-line spam” while still providing progressive output.

Coalescing waits for idle gaps (idleMs) before flushing.
缓冲区受 maxChars 限制，超过时将刷新。
minChars 防止微小片段发送，直到累积足够文本（最终刷新始终发送剩余文本）。
连接符从 blockStreamingChunk.breakPreference 派生（paragraph → \n\n，newline → \n，sentence → 空格）。
渠道覆盖通过 *.blockStreamingCoalesce 可用（包括每账户配置）。
除非覆盖，Signal/Slack/Discord 的默认合并 minChars 提高到 1500。

块之间的类人节奏

启用分块流式传输时，你可以在块回复之间添加随机暂停（在第一个块之后）。这使多气泡响应感觉更自然。 This makes multi-bubble responses feel more natural.

配置：agents.defaults.humanDelay（通过 agents.list[].humanDelay 按智能体覆盖）。
模式：off（默认）、natural（800–2500ms）、custom（minMs/maxMs）。
仅适用于块回复，不适用于最终回复或工具摘要。

“流式传输块或全部内容”

这映射到：

流式传输块： blockStreamingDefault: "on" + blockStreamingBreak: "text_end"（边生成边发出）。非 Telegram 渠道还需要 *.blockStreaming: true。 Non-Telegram channels also need *.blockStreaming: true.
最后流式传输全部内容： blockStreamingBreak: "message_end"（刷新一次，如果很长可能有多个块）。
无分块流式传输： blockStreamingDefault: "off"（只有最终回复）。

渠道说明： 对于非 Telegram 渠道，分块流式传输默认关闭，除非 *.blockStreaming 明确设置为 true。Telegram 可以在没有块回复的情况下流式传输草稿（channels.telegram.streamMode）。 Telegram 可以流式传输实时预览 (channels.telegram.streamMode)，而无需分块回复。配置位置提醒：blockStreaming* 默认值位于 agents.defaults 下，而不是根配置。

Telegram 草稿流式传输（类令牌）

Telegram 是唯一支持草稿流式传输的渠道：

使用 Bot API sendMessage（首次更新）+ editMessageText（后续更新）。
channels.telegram.streamMode: "partial" | "block" | "off"。
- partial：用最新的流式文本更新草稿。
- block：以分块方式更新草稿（相同的分块器规则）。
- off：无草稿流式传输。
草稿分块配置（仅用于 streamMode: "block"）：channels.telegram.draftChunk（默认值：minChars: 200，maxChars: 800）。
预览流式传输与分块流式传输是分开的。
当显式启用 Telegram 分块流式传输时，将跳过预览流式传输以避免双重流式传输。
纯文本最终结果通过就地编辑预览消息来应用。
非文本/复杂的最终结果将回退为常规的最终消息发送方式。
/reasoning stream 会将推理内容写入实时预览（仅限 Telegram）。

Telegram（私聊 + 主题）
  └─ sendMessageDraft（草稿气泡）
       ├─ streamMode=partial → 更新最新文本
       └─ streamMode=block   → 分块器更新草稿
  └─ 最终回复 → 普通消息

Legend:

preview message：在生成过程中更新的临时 Telegram 消息。
final edit：在同一个预览消息上的就地编辑（仅文本）。

基础

引导初始化

会话与内存

多智能体

消息与传递

Streaming and Chunking

流式传输 + 分块

分块流式传输（渠道消息）

分块算法（低/高边界）

合并（合并流式块）

块之间的类人节奏

“流式传输块或全部内容”

Telegram 草稿流式传输（类令牌）

基础

引导初始化

会话与内存

多智能体

消息与传递

​流式传输 + 分块

​分块流式传输（渠道消息）

​分块算法（低/高边界）

​合并（合并流式块）

​块之间的类人节奏

​“流式传输块或全部内容”

​Telegram 草稿流式传输（类令牌）

流式传输 + 分块

分块流式传输（渠道消息）

分块算法（低/高边界）

合并（合并流式块）

块之间的类人节奏

“流式传输块或全部内容”

Telegram 草稿流式传输（类令牌）