Talk-läge
Talk-läge är en kontinuerlig röstkonversationsloop:- Lyssna efter tal
- Skicka transkriptionen till modellen (huvudsession, chat.send)
- Vänta på svaret
- Läs upp det via ElevenLabs (strömmad uppspelning)
Beteende (macOS)
- Alltid-på-överlägg medan Talk-läge är aktiverat.
- Fasövergångar Lyssnar → Tänker → Talar.
- Vid en kort paus (tystnadsfönster) skickas den aktuella transkriptionen.
- Svar skrivs till WebChat (samma som att skriva).
- Avbryt vid tal (på som standard): om användaren börjar prata medan assistenten talar stoppar vi uppspelningen och noterar avbrottets tidsstämpel för nästa prompt.
Röstdirektiv i svar
Assistenten kan inleda sitt svar med en enda JSON-rad för att styra rösten:- Endast första icke-tomma raden.
- Okända nycklar ignoreras.
once: truegäller endast för det aktuella svaret.- Utan
onceblir rösten den nya standarden för Talk-läge. - JSON-raden tas bort före TTS-uppspelning.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Konfig (~/.openclaw/openclaw.json)
interruptOnSpeech: truevoiceId: faller tillbaka tillELEVENLABS_VOICE_ID/SAG_VOICE_ID(eller första ElevenLabs-rösten när API-nyckel är tillgänglig)modelId: standard tilleleven_v3när den inte är sattapiKey: faller tillbaka tillELEVENLABS_API_KEY(eller gateway-skalprofil om tillgänglig)outputFormat: standard tillpcm_44100på macOS/iOS ochpcm_24000på Android (ställ inmp3_*för att tvinga MP3-strömning)
macOS-gränssnitt
- Menyradsväxel: Talk
- Konfigflik: gruppen Talk-läge (röst-id + avbrottsväxel)
- Överlägg:
- Lyssnar: moln pulserar med mikrofonnivå
- Tänker: sjunkande animation
- Talar: utstrålande ringar
- Klicka på molnet: stoppa tal
- Klicka på X: avsluta Talk-läge
Noteringar
- Kräver behörigheter för Tal + Mikrofon.
- Använder
chat.sendmot sessionsnyckelnmain. - TTS använder ElevenLabs strömnings-API med
ELEVENLABS_API_KEYoch inkrementell uppspelning på macOS/iOS/Android för lägre latens. stabilityföreleven_v3valideras till0.0,0.5eller1.0; andra modeller accepterar0..1.latency_tiervalideras till0..4när den är satt.- Android stöder utdataformaten
pcm_16000,pcm_22050,pcm_24000ochpcm_44100för låg-latens AudioTrack-strömning.