المكالمات الصوتية (ملحق)
مكالمات صوتية لـ OpenClaw عبر ملحق. يدعم الإشعارات الصادرة والمحادثات متعددة الأدوار مع سياسات المكالمات الواردة. الموفّرون الحاليون:twilio(الصوت القابل للبرمجة + تدفقات الوسائط)telnyx(التحكم بالمكالمات v2)plivo(واجهة برمجة الصوت + نقل XML + إدخال الكلام GetInput)mock(تطوير/بدون شبكة)
- تثبيت الملحق
- إعادة تشغيل Gateway
- التهيئة ضمن
plugins.entries.voice-call.config - الاستخدام عبر
openclaw voicecall ...أو أداةvoice_call
أين يعمل (محلي مقابل بعيد)
يعمل ملحق المكالمات الصوتية داخل عملية Gateway. إذا كنت تستخدم Gateway بعيدًا، فقم بتثبيت/تهيئة الملحق على الجهاز الذي يشغّل Gateway، ثم أعد تشغيل Gateway لتحميله.التثبيت
الخيار A: التثبيت من npm (موصى به)
الخيار B: التثبيت من مجلد محلي (تطوير، بدون نسخ)
التهيئة
اضبط التهيئة ضمنplugins.entries.voice-call.config:
- يتطلب Twilio/Telnyx عنوان URL لخطاف ويب قابل للوصول علنًا.
- يتطلب Plivo عنوان URL لخطاف ويب قابل للوصول علنًا.
mockهو موفّر تطوير محلي (بدون مكالمات شبكة).- يتطلب Telnyx قيمة
telnyx.publicKey(أوTELNYX_PUBLIC_KEY) ما لم تكنskipSignatureVerificationمفعّلة. skipSignatureVerificationمخصّص للاختبار المحلي فقط.- إذا استخدمت فئة ngrok المجانية، فاضبط
publicUrlعلى عنوان ngrok الدقيق؛ يتم دائمًا فرض التحقق من التوقيع. - يسمح
tunnel.allowNgrokFreeTierLoopbackBypass: trueبخطافات ويب Twilio ذات التواقيع غير الصالحة فقط عندما يكونtunnel.provider="ngrok"وserve.bindحلقة رجوع (وكيل ngrok المحلي). استخدمه للتطوير المحلي فقط. - قد تتغير عناوين ngrok في الفئة المجانية أو تضيف سلوكيات وسيطة؛ إذا انحرف
publicUrlفستفشل تواقيع Twilio. للإنتاج، فضّل نطاقًا ثابتًا أو نفق Tailscale.
أمان خطافات الويب
عندما يكون هناك وكيل أو نفق أمام Gateway، يعيد الملحق بناء عنوان URL العام للتحقق من التوقيع. تتحكم هذه الخيارات في أي ترويسات مُعاد توجيهها يتم الوثوق بها.webhookSecurity.allowedHosts يضيف قائمة سماح للمضيفين من ترويسات إعادة التوجيه.
webhookSecurity.trustForwardingHeaders يثق بترويسات إعادة التوجيه دون قائمة سماح.
webhookSecurity.trustedProxyIPs يثق بترويسات إعادة التوجيه فقط عندما يطابق
عنوان IP البعيد للطلب القائمة.
مثال مع مضيف عام ثابت:
TTS للمكالمات
تستخدم المكالمات الصوتية تهيئةmessages.tts الأساسية (OpenAI أو ElevenLabs) لـ
بثّ الكلام أثناء المكالمات. يمكنك تجاوزها ضمن تهيئة الملحق
بنفس البنية — حيث يتم الدمج العميق مع messages.tts.
- يتم تجاهل Edge TTS للمكالمات الصوتية (صوت الاتصالات يتطلب PCM؛ ومخرجات Edge غير موثوقة).
- يتم استخدام TTS الأساسي عند تمكين بث وسائط Twilio؛ وإلا فستعود المكالمات إلى الأصوات الأصلية لدى الموفّر.
مزيد من الأمثلة
استخدام TTS الأساسي فقط (بدون تجاوز):المكالمات الواردة
تكون سياسة المكالمات الواردة افتراضيًاdisabled. لتمكين المكالمات الواردة، اضبط:
responseModelresponseSystemPromptresponseTimeoutMs
CLI
أداة الوكيل
اسم الأداة:voice_call
الإجراءات:
initiate_call(message, to?, mode?)continue_call(callId, message)speak_to_user(callId, message)end_call(callId)get_status(callId)
skills/voice-call/SKILL.md.
استدعاء RPC لـ Gateway
voicecall.initiate(to?,message,mode?)voicecall.continue(callId,message)voicecall.speak(callId,message)voicecall.end(callId)voicecall.status(callId)