Tryb rozmowy
Tryb rozmowy to ciągła pętla rozmowy głosowej:- Nasłuchiwanie mowy
- Wysłanie transkrypcji do modelu (sesja główna, chat.send)
- Oczekiwanie na odpowiedź
- Odtworzenie jej przez ElevenLabs (odtwarzanie strumieniowe)
Zachowanie (macOS)
- Zawsze widoczna nakładka podczas włączonego trybu rozmowy.
- Przejścia faz Słuchanie → Myślenie → Mówienie.
- Przy krótkiej pauzie (okno ciszy) bieżąca transkrypcja jest wysyłana.
- Odpowiedzi są zapisywane w WebChat (tak samo jak przy pisaniu).
- Przerywanie mową (domyślnie włączone): jeśli użytkownik zacznie mówić, gdy asystent mówi, zatrzymujemy odtwarzanie i zapisujemy znacznik czasu przerwania dla następnego promptu.
Dyrektywy głosu w odpowiedziach
Asystent może poprzedzić swoją odpowiedź pojedynczą linią JSON, aby sterować głosem:- Tylko pierwsza niepusta linia.
- Nieznane klucze są ignorowane.
once: truedotyczy wyłącznie bieżącej odpowiedzi.- Bez
oncegłos staje się nową domyślną wartością dla trybu rozmowy. - Linia JSON jest usuwana przed odtwarzaniem TTS.
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Konfiguracja (~/.openclaw/openclaw.json)
interruptOnSpeech: truevoiceId: powrót doELEVENLABS_VOICE_ID/SAG_VOICE_ID(lub pierwszego głosu ElevenLabs, gdy dostępny jest klucz API)modelId: domyślnieeleven_v3, gdy nieustawioneapiKey: powrót doELEVENLABS_API_KEY(lub profilu powłoki gateway, jeśli dostępny)outputFormat: domyślniepcm_44100na macOS/iOS orazpcm_24000na Androidzie (ustawmp3_*, aby wymusić strumieniowanie MP3)
Interfejs macOS
- Przełącznik na pasku menu: Talk
- Karta konfiguracji: grupa Talk Mode (ID głosu + przełącznik przerywania)
- Nakładka:
- Listening: pulsująca chmura z poziomem mikrofonu
- Thinking: animacja opadania
- Speaking: promieniujące pierścienie
- Kliknij chmurę: zatrzymaj mówienie
- Kliknij X: wyjdź z trybu rozmowy
Uwagi
- Wymaga uprawnień do Mowy + Mikrofonu.
- Używa
chat.sendwzględem klucza sesjimain. - TTS korzysta ze strumieniowego API ElevenLabs z
ELEVENLABS_API_KEYoraz przyrostowym odtwarzaniem na macOS/iOS/Android dla niższych opóźnień. stabilitydlaeleven_v3jest weryfikowane do0.0,0.5lub1.0; inne modele akceptują0..1.latency_tierjest weryfikowane do0..4po ustawieniu.- Android obsługuje formaty wyjścia
pcm_16000,pcm_22050,pcm_24000orazpcm_44100dla niskolatencyjnego strumieniowania AudioTrack.