: تحاكي Eva تعبيرات وجه الإنسان في الوقت الفعلي من كاميرا بث مباشر. يتم تعلم النظام بأكمله بدون تسميات بشرية. تتعلم Eva قدرتين أساسيتين: 1) توقع الشكل الذي سيبدو عليه إذا كان يقوم بتعبير وجه ملحوظ ، يُعرف بالصورة الذاتية ؛ 2) رسم وجهه المتخيل للأفعال الجسدية. الائتمان: مختبر الآلات الإبداعية / هندسة كولومبيا
بينما تلعب تعابير وجهنا دورًا كبيرًا في بناء الثقة ، فإن معظم الروبوتات لا تزال تتمتع بالرؤية الفارغة والثابتة للاعب البوكر المحترف. مع الاستخدام المتزايد للروبوتات في المواقع التي تحتاج فيها الروبوتات والبشر إلى العمل معًا بشكل وثيق ، من دور رعاية المسنين إلى المستودعات والمصانع ، أصبحت الحاجة إلى روبوت أكثر استجابة وواقعية للوجه أكثر إلحاحًا.
منذ فترة طويلة مهتمًا بالتفاعلات بين الروبوتات والبشر ، عمل الباحثون في مختبر الآلات الإبداعية في كولومبيا للهندسة لمدة خمس سنوات على إنشاء EVA ، وهو روبوت جديد مستقل ذو وجه ناعم ومعبّر يستجيب لتتناسب مع تعبيرات البشر القريبين. سيتم تقديم البحث في مؤتمر ICRA في 30 مايو 2021 ، ومخططات الروبوت مفتوحة المصدر على Hardware-X (أبريل 2021).
قال هود ليبسون ، أستاذ الابتكار في جيمس وسالي سكابا: “تبلورت فكرة EVA قبل بضع سنوات ، عندما بدأت أنا وطلابي نلاحظ أن الروبوتات في مختبرنا كانت تحدق فينا مرة أخرى من خلال عيون بلاستيكية مثل googly”. الهندسة الميكانيكية) ومدير معمل الآلات الإبداعية.
لاحظ ليبسون اتجاهًا مشابهًا في محل البقالة ، حيث واجه إعادة تخزين الروبوتات التي تحمل شارات الأسماء ، وفي إحدى الحالات ، كان يرتدي غطاءً مريحًا ومحبوكًا يدويًا. قال: “يبدو أن الناس يقومون بإضفاء الطابع الإنساني على زملائهم الآليين من خلال إعطائهم عيونًا أو هوية أو اسمًا”. “هذا جعلنا نتساءل ، إذا كانت العيون والملابس تعمل ، فلماذا لا نصنع إنسانًا آليًا له وجه بشري فائق التعبير والاستجابة؟”
في حين أن هذا يبدو بسيطًا ، إلا أن إنشاء وجه آلي مقنع كان تحديًا هائلاً لعلماء الروبوتات. لعقود من الزمان ، كانت أجزاء الجسم الروبوتية مصنوعة من المعدن أو البلاستيك الصلب ، وهي مواد كانت شديدة الصلابة بحيث لا تسمح بالتدفق والتحرك بالطريقة التي تعمل بها الأنسجة البشرية. كانت الأجهزة الروبوتية بدائية بالمثل ويصعب العمل معها – الدوائر وأجهزة الاستشعار والمحركات ثقيلة وتستهلك طاقة كبيرة وضخمة.
بدأت المرحلة الأولى من المشروع في مختبر ليبسون قبل عدة سنوات عندما قاد الطالب الجامعي زانوار فرج فريقًا من الطلاب في بناء “الآلات” المادية للروبوت. قاموا ببناء EVA كتمثال نصفي غير متجسد يحمل تشابهًا قويًا مع فناني الأداء الصامت والوجهين لمجموعة Blue Man Group. يمكن أن تعبر EVA عن المشاعر الستة الأساسية للغضب ، والاشمئزاز ، والخوف ، والفرح ، والحزن ، والمفاجأة ، بالإضافة إلى مجموعة من المشاعر الأكثر دقة ، باستخدام “عضلات” اصطناعية (مثل الكابلات والمحركات) التي تسحب نقاطًا محددة في EVA الوجه ، يحاكي حركات أكثر من 42 عضلة صغيرة مرتبطة في نقاط مختلفة بجلد وعظام وجوه الإنسان.
وأشار فرج إلى أن “التحدي الأكبر في إنشاء EVA كان تصميم نظام مضغوط بما يكفي ليلائم حدود جمجمة بشرية بينما لا يزال يعمل بما يكفي لإنتاج مجموعة واسعة من تعابير الوجه”.
للتغلب على هذا التحدي ، اعتمد الفريق بشكل كبير على الطباعة ثلاثية الأبعاد لتصنيع الأجزاء ذات الأشكال المعقدة التي تتكامل بسلاسة وكفاءة مع جمجمة EVA. بعد أسابيع من سحب الكابلات لجعل إيفا تبتسم أو تتجهم أو تبدو منزعجة ، لاحظ الفريق أن وجه إيفا الأزرق غير المتجسد يمكن أن يثير ردود فعل عاطفية من زملائهم في المختبر. يتذكر ليبسون: “كنت أفكر في عملي الخاص يومًا ما عندما أعطتني إيفا فجأة ابتسامة كبيرة وودية”. “كنت أعلم أنها كانت ميكانيكية بحتة ، لكنني وجدت نفسي أبتسم بشكل انعكاسي.”
بمجرد أن كان الفريق راضياً عن “ميكانيكا” EVA ، بدأوا في معالجة المرحلة الرئيسية الثانية للمشروع: برمجة الذكاء الاصطناعي الذي من شأنه أن يوجه حركات وجه EVA. بينما تم استخدام الروبوتات المتحركة النابضة بالحياة في الحدائق الترفيهية واستوديوهات الأفلام لسنوات ، حقق فريق Lipson تقدمين تقنيين. تستخدم EVA الذكاء الاصطناعي للتعلم العميق “للقراءة” ثم عكس التعبيرات الموجودة على الوجوه البشرية القريبة. وقدرة EVA على تقليد مجموعة واسعة من تعابير الوجه البشرية المختلفة يتم تعلمها من خلال التجربة والخطأ من خلال مشاهدة مقاطع الفيديو الخاصة بها.
تتضمن أصعب الأنشطة البشرية لأتمتة حركات جسدية غير متكررة تحدث في أماكن اجتماعية معقدة. سرعان ما أدرك Boyuan Chen ، طالب الدكتوراه في Lipson والذي قاد مرحلة البرمجيات في المشروع ، أن حركات وجه EVA معقدة للغاية بحيث لا يمكن التحكم فيها من خلال مجموعات محددة مسبقًا من القواعد. لمواجهة هذا التحدي ، أنشأ تشين وفريق ثان من الطلاب دماغ EVA باستخدام العديد من الشبكات العصبية للتعلم العميق. يحتاج دماغ الروبوت إلى إتقان قدرات: أولاً ، تعلم استخدام نظامه المعقد الخاص بالعضلات الميكانيكية لتوليد أي تعبير معين للوجه ، وثانيًا ، معرفة الوجوه التي يجب صنعها من خلال “قراءة” وجوه البشر.
لتعليم EVA كيف يبدو شكل وجهها ، صور Chen وفريقه ساعات من لقطات EVA وهم يصنعون سلسلة من الوجوه العشوائية. بعد ذلك ، مثل الإنسان الذي يشاهد نفسه على Zoom ، تعلمت الشبكات العصبية الداخلية لإيفا أن تقرن حركة العضلات مع لقطات فيديو لوجهها. الآن بعد أن أصبح لدى EVA إحساس بدائي بكيفية عمل وجهها (المعروفة باسم “الصورة الذاتية”) ، استخدمت شبكة ثانية لمطابقة صورتها الذاتية مع صورة وجه بشري تم التقاطها على كاميرا الفيديو الخاصة بها. بعد العديد من التحسينات والتكرارات ، اكتسبت EVA القدرة على قراءة إيماءات الوجه البشري من الكاميرا ، والاستجابة من خلال عكس تعبيرات وجه ذلك الإنسان.
لاحظ الباحثون أن EVA هي تجربة معملية ، وأن المحاكاة وحدها لا تزال بعيدة كل البعد عن الطرق المعقدة التي يتواصل بها البشر باستخدام تعابير الوجه. لكن مثل هذه التقنيات التمكينية يمكن أن يكون لها في يوم من الأيام تطبيقات مفيدة في العالم الحقيقي. على سبيل المثال ، الروبوتات القادرة على الاستجابة لمجموعة متنوعة من لغة الجسد البشرية ستكون مفيدة في أماكن العمل والمستشفيات والمدارس والمنازل.
قال ليبسون: “هناك حد لمدى تفاعلنا نحن البشر عاطفياً مع برامج الدردشة المستندة إلى السحابة أو مكبرات الصوت المنزلية الذكية غير المجسدة”. “يبدو أن أدمغتنا تستجيب بشكل جيد للروبوتات التي لديها نوع من الوجود المادي المميز.”
وأضاف تشين ، “تتشابك الروبوتات في حياتنا بعدد متزايد من الطرق ، لذا فإن بناء الثقة بين البشر والآلات أمر مهم بشكل متزايد.”