توقّع وانغ شينغشينغ، مؤسس شركة Unitree Robotics الصينية المتخصصة في صناعة الروبوتات، أن يشهد هذا القطاع قفزة نوعية شبيهة بما أحدثه شات جي بي تي في الذكاء الاصطناعي، وذلك في غضون عامين فقط، في حال تم تطوير تقنيات ذكاء اصطناعي قادرة على التحكم الفعّال في حركات الروبوتات.
وفي كلمته خلال المؤتمر العالمي للروبوتات في بكين، أشار وانغ إلى أن هذه اللحظة المفصلية ستحدث عندما يتمكن الروبوت من تنفيذ مهام معقدة كتنظيف غرفة أو إحضار زجاجة ماء في بيئة لم يتعامل معها من قبل.
وأوضح أن هذه الطفرة قد تتحقق خلال عام إلى ثلاثة أعوام، على الرغم من التقدم الكبير في الأجهزة والبيانات المتوفرة لتدريب الروبوتات. وبيّن أن التحدي الحقيقي يكمن في ما أسماه بـ”الذكاء الاصطناعي المتجسد”، الذي لا يزال في مراحل غير مكتملة.
وانتقد وانغ الاعتماد الكامل على نماذج لغة الرؤية (VLA)، مؤكدًا أن أداءها الحالي لا يرقى إلى المستوى المطلوب لأداء المهام المعقدة بدقة، رغم استخدامها إلى جانب التعلم التعزيزي في شركته. وقال إن هذا النهج يحتاج إلى مزيد من التطوير والابتكار.
كما استعرض نهجًا آخر واعدًا يعتمد على إنشاء نموذج فيديو أو محاكاة تفاعلية عبر أوامر نصية، يتم من خلالها توجيه الروبوت لتنفيذ مهام محددة. واعتبر أن هذا المسار قد يحقق نتائج أفضل، مستشهدًا بنموذج Genie 3 من “غوغل” كمثال على التقدم المتسارع في هذا المجال.
وتطرّق وانغ أيضًا إلى بعض التحديات، وعلى رأسها الحاجة إلى عدد كبير من وحدات معالجة الرسوميات (GPUs) لتوليد صور عالية الجودة، والتي قد تتجاوز في بعض الأحيان متطلبات تدريب الروبوت نفسه.
ورغم هذه العقبات، عبّر وانغ عن تفاؤله بالمستقبل، مشيرًا إلى أن ظهور نماذج مثل “شات جي بي تي” من OpenAI و”ديب سيك” الصينية دليل على أن الطفرات التقنية الكبرى قد تأتي بشكل مفاجئ، لكنها تُحدث تحولًا جذريًا في المسار التقني.