Talk-modus
Talk-modus is een doorlopende spraakgesprekslus:- Luisteren naar spraak
- Transcript naar het model sturen (hoofdsessie, chat.send)
- Wachten op het antwoord
- Het antwoord uitspreken via ElevenLabs (streamende weergave)
Gedrag (macOS)
- Altijd-aan overlay terwijl Talk-modus is ingeschakeld.
- Faseovergangen Luisteren → Denken → Spreken.
- Bij een korte pauze (stiltevenster) wordt het huidige transcript verzonden.
- Antwoorden worden geschreven naar WebChat (hetzelfde als typen).
- Onderbreken bij spraak (standaard aan): als de gebruiker begint te praten terwijl de assistent spreekt, stoppen we de weergave en noteren we de tijdstempel van de onderbreking voor de volgende prompt.
Stemrichtlijnen in antwoorden
De assistent kan zijn antwoord vooraf laten gaan door één enkele JSON-regel om de stem te sturen:- Alleen de eerste niet-lege regel.
- Onbekende sleutels worden genegeerd.
once: trueis alleen van toepassing op het huidige antwoord.- Zonder
oncewordt de stem de nieuwe standaard voor Talk-modus. - De JSON-regel wordt verwijderd vóór TTS-weergave.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Configuratie (~/.openclaw/openclaw.json)
interruptOnSpeech: truevoiceId: valt terug opELEVENLABS_VOICE_ID/SAG_VOICE_ID(of de eerste ElevenLabs-stem wanneer een API-sleutel beschikbaar is)modelId: standaardeleven_v3wanneer niet ingesteldapiKey: valt terug opELEVENLABS_API_KEY(of het Gateway shell-profiel indien beschikbaar)outputFormat: standaardpcm_44100op macOS/iOS enpcm_24000op Android (stelmp3_*in om MP3-streaming af te dwingen)
macOS-UI
- Menubalkschakelaar: Talk
- Config-tab: Talk-modus-groep (stem-id + onderbrekingsschakelaar)
- Overlay:
- Luisteren: wolk pulseert met microfoonniveau
- Denken: inzakkende animatie
- Spreken: uitstralende ringen
- Klik op de wolk: stop met spreken
- Klik op X: verlaat Talk-modus
Notities
- Vereist spraak- en microfoonrechten.
- Gebruikt
chat.sendtegen sessiesleutelmain. - TTS gebruikt de ElevenLabs streaming-API met
ELEVENLABS_API_KEYen incrementele weergave op macOS/iOS/Android voor lagere latentie. stabilityvooreleven_v3wordt gevalideerd naar0.0,0.5of1.0; andere modellen accepteren0..1.latency_tierwordt bij instellen gevalideerd naar0..4.- Android ondersteunt de uitvoerformaten
pcm_16000,pcm_22050,pcm_24000enpcm_44100voor AudioTrack-streaming met lage latentie.