Manufacturing / ProductionConfidential2 months ago
Experience الخبرة
More Than 3 Years
Career Level المستوى
Experienced (Non-Manager)
Education التعليم
Not Specified
Salary الراتب
Confidential
Skills Required المهارات المطلوبة
IT/Software DevelopmentEngineering - Telecom/TechnologyEngineering - Mechanical/ElectricalAIComputer ScienceEngineeringInformation Technology (IT)Software Development
Job Description الوصف الوظيفي
حول الدور
نحن نبحث عن مهندس لا "يتحدث" مع LLMs فحسب، بل يبني أنظمة مستقلة ومرنة. ستقوم بتصميم بنية متعددة الوكلاء يمكنها التفكير واستخدام الأدوات والتعافي من حالات الفشل بشكل مستقل.
هدفك الأساسي هو سد الفجوة بين "العروض التوضيحية الرائعة" و"الموثوقية على مستوى الإنتاج". ستكون مسؤولاً عن نشر الوكلاء عبر قطاعات الأعمال المختلفة (مثل الشؤون المالية والعمليات ونجاح العملاء)، مما يضمن أنهم ليسوا أذكياء فحسب، بل آمنين أيضًا، وفعالين من حيث التكلفة، ويمكن التنبؤ بهم في بيئة الإنتاج.
المسؤوليات الرئيسية
● تنسيق الوكيل: تصميم وتنفيذ عمليات سير عمل الوكيل متعددة المنعطفات باستخدام أطر عمل مثل LangGraph أو CrewAI أو AutoGen أو PydanticAI أو Swarm أو Haystack أو Bee Agent Framework.
● الموثوقية الاستباقية وحواجز الحماية: أنظمة هندسية تمنع انهيارات الإنتاج. قم بتنفيذ قواطع الدائرة، ومشغلات "الإنسان في الحلقة"، وحواجز حماية الإدخال/الإخراج لإيقاف الحلقات اللانهائية، والحقن الفوري، واستدعاءات الأداة المهلوسة قبل أن تصل إلى المستخدم النهائي.
● الأدوات متعددة القطاعات: إنشاء وصيانة عمليات تكامل (أدوات) عالية الدقة لواجهة برمجة التطبيقات (API) التي تسمح للوكلاء بالتفاعل مع أنظمة الأعمال المتنوعة (تخطيط موارد المؤسسات (ERP)، وإدارة علاقات العملاء (CRM)، وقواعد البيانات المخصصة) بشكل حتمي.
● إمكانية المراقبة والتتبع: قم بإعداد التتبع المتقدم (على سبيل المثال، LangSmith أو Langfuse أو Arize Phoenix) لتصحيح أخطاء سلاسل التفكير المعقدة ومراقبة مسارات الوكيل في الوقت الفعلي.
● التقييم الدقيق (Evals): تطوير "مجموعات البيانات الذهبية" وأطر التقييم الآلية (باستخدام RAGas أو DeepEval أو G-Eval أو LangSmith Evaluators أو التصنيف المخصص المستند إلى النموذج) لقياس معدلات نجاح الوكيل ومنع التراجعات قبل كل عملية نشر.
● تحسين التكلفة ووقت الاستجابة: إدارة "ميزانية الرمز المميز" من خلال تنفيذ توجيه النموذج المتدرج (على سبيل المثال، استخدام Gemini 3 Flash للاستدلال الأولي وUltra للتحقق النهائي) وتحسين استخدام نافذة السياق.