Talk मोड
Talk मोड एक सतत वॉइस वार्तालाप लूप है:- भाषण सुनें
- ट्रांसक्रिप्ट को मॉडल को भेजें (मुख्य सत्र, chat.send)
- प्रतिक्रिया की प्रतीक्षा करें
- ElevenLabs के माध्यम से उसे बोलें (स्ट्रीमिंग प्लेबैक)
व्यवहार (macOS)
- Talk मोड सक्षम होने पर हमेशा-ऑन ओवरले।
- Listening → Thinking → Speaking चरण संक्रमण।
- छोटे विराम (मौन विंडो) पर, वर्तमान ट्रांसक्रिप्ट भेज दिया जाता है।
- उत्तर WebChat में लिखे जाते हैं (टाइप करने के समान)।
- भाषण पर इंटरप्ट (डिफ़ॉल्ट चालू): यदि सहायक बोलते समय उपयोगकर्ता बोलना शुरू करता है, तो हम प्लेबैक रोक देते हैं और अगले प्रॉम्प्ट के लिए इंटरप्शन टाइमस्टैम्प नोट करते हैं।
उत्तरों में वॉइस निर्देश
सहायक वॉइस को नियंत्रित करने के लिए अपने उत्तर की शुरुआत में एकल JSON पंक्ति जोड़ सकता है:- केवल पहली गैर-खाली पंक्ति।
- अज्ञात कुंजियाँ अनदेखी की जाती हैं।
once: trueकेवल वर्तमान उत्तर पर लागू होता है।onceके बिना, वॉइस Talk मोड के लिए नया डिफ़ॉल्ट बन जाता है।- JSON पंक्ति TTS प्लेबैक से पहले हटा दी जाती है।
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
विन्यास (~/.openclaw/openclaw.json)
interruptOnSpeech: truevoiceId:ELEVENLABS_VOICE_ID/SAG_VOICE_IDपर फ़ॉलबैक (या API कुंजी उपलब्ध होने पर पहला ElevenLabs वॉइस)modelId: अनसेट होने परeleven_v3पर डिफ़ॉल्टapiKey:ELEVENLABS_API_KEYपर फ़ॉलबैक (या उपलब्ध होने पर gateway शेल प्रोफ़ाइल)outputFormat: macOS/iOS परpcm_44100और Android परpcm_24000पर डिफ़ॉल्ट (MP3 स्ट्रीमिंग को मजबूर करने के लिएmp3_*सेट करें)
macOS उपयोगकर्ता इंटरफ़ेस
- मेनू बार टॉगल: Talk
- कॉन्फ़िग टैब: Talk Mode समूह (वॉइस आईडी + इंटरप्ट टॉगल)
- ओवरले:
- Listening: माइक्रोफ़ोन स्तर के साथ क्लाउड पल्स
- Thinking: डूबती हुई एनीमेशन
- Speaking: फैलते हुए रिंग्स
- क्लाउड पर क्लिक: बोलना रोकें
- X पर क्लिक: Talk मोड से बाहर निकलें
नोट्स
- Speech + Microphone अनुमतियों की आवश्यकता है।
- सत्र कुंजी
mainके विरुद्धchat.sendका उपयोग करता है। - TTS कम विलंबता के लिए macOS/iOS/Android पर
ELEVENLABS_API_KEYऔर इन्क्रिमेंटल प्लेबैक के साथ ElevenLabs स्ट्रीमिंग API का उपयोग करता है। eleven_v3के लिएstabilityको0.0,0.5, या1.0तक मान्य किया जाता है; अन्य मॉडल0..1स्वीकार करते हैं।latency_tierसेट होने पर0..4तक मान्य किया जाता है।- Android कम विलंबता AudioTrack स्ट्रीमिंग के लिए
pcm_16000,pcm_22050,pcm_24000, औरpcm_44100आउटपुट फ़ॉर्मैट्स का समर्थन करता है।