أنشرها:

جاكرتا - قدمت Nvidia خدمة تحكم جديدة تسمح للمطورين بالعمل على مشروع يتضمن روبوتات إنسانية ، يتم التحكم فيها ومراقبتها باستخدام Apple Vision Pro.

يواجه تطوير روبوتات الإنسانية نفسها حاليا العديد من التحديات. واحد منهم هو التحكم في هذا الجهاز الفني للغاية. للمساعدة في هذا المجال ، قدمت Nvidia عددا من الأدوات للمحاكاة الروبوتية ، بما في ذلك بعضها المساعد في التحكم.

يتم توفير هذه الأدوات من قبل Nvidia للمصنعين الرئيسيين للروبوتات ومطوري البرامج. تهدف مجموعة النموذج والمنصة إلى تدريب جيل جديد من الروبوتات الإنسانية.

تتضمن مجموعة الأدوات هذه ما تسميه Nvidia NIM خدمة NIM صغيرة وإطارا يهدف إلى المحاكاة والتعلم. هناك أيضا خدمة تنسيق Nvidia OSMO للتعامل مع أعباء العمل الروبوتية متعددة المراحل ، بالإضافة إلى خطوط العمل التي تعمل عن بعد المدعومة الذكاء الاصطناعي والمحاكاة.

كجزء من مسار العمل هذا ، يمكن استخدام سماعات الرأس وأجهزة الحوسبة المكانية مثل Apple Vision Pro ليس فقط لعرض البيانات ولكن أيضا للتحكم في الأجهزة.

"الموجة التالية من الذكاء الاصطناعي هي الروبوتات وأحد أكثر التطورات جاذبية هو الروبوتات الإنسانية" ، قال الرئيس التنفيذي والمؤسس لشركة Nvidia ، جنسن هوانغ. "لقد طورنا كومة كاملة من الروبوتات NVIDIA ، مما يفتح الوصول للمطورين والشركات الإنسانية في جميع أنحاء العالم لاستخدام المنصات ومكتبات التسارع ونماذج الذكاء الاصطناعي الأكثر ملاءمة لاحتياجاتهم."

الخدمة الصغيرة ل NIM هي حاوية ما قبل البناء تستخدم برنامج NvidiaInference ، والذي يهدف إلى تقليل وقت التنفيذ. تم تصميم اثنين من هذه الخدمات الصغيرة لمساعدة المطورين على تدفق عمل المحاكاة للحصول على الذكاء الاصطناعي المادي التوليدي في Nvidia Isaac SIM ، وهو تطبيق مرجع.

يتم استخدام إحدى هذه الخدمات الصغيرة ، MimicGen NIM ، لمساعدة المستخدمين على التحكم في الأجهزة باستخدام Apple Vision Pro ، أو أجهزة الحوسبة المكانية الأخرى. تنتج هذه الخدمة بيانات الحركة الاصطناعية للروبوتات استنادا إلى "بيانات التشغيل عن بعد المسجلة" ، والتي تترجم الحركات من Apple Vision Pro إلى الحركات التي سيقوم بها الروبوت.

تظهر مقاطع الفيديو والصور أنها تتعلق أكثر من مجرد تحريك الكاميرا بناء على حركات سماعة الرأس. يظهر أن حركات اليد والأعلام يتم تسجيلها واستخدامها أيضا ، استنادا إلى مستشعر Apple Vision Pro.

وبالتالي ، يمكن للمستخدمين رؤية تحركات الروبوت والتحكم مباشرة في اليدين والذراعين ، وكلهم يستخدمون Apple Vision Pro.

على الرغم من أن مثل هذه الروبوتات الإنسانية يمكن أن تحاول تقليد الحركة بدقة ، إلا أن أنظمة مثل Nvidia يمكن أن تفسر ما يريد المستخدم القيام به. نظرا لأن المستخدم ليس لديه تعليقات تكتيكية على ما يحمله الروبوت ، فقد يكون من الخطير للغاية تقليد حركات اليد مباشرة.

كما سمحت تيارات العمل الأخرى للعمليات عن بعد المعروضة في Siggraph للمطورين بإنشاء كمية كبيرة من بيانات الحركة والإدراك. كلها تتكون من عدد صغير من المظاهرات التي يتم التقاطها عن بعد من قبل البشر.

بالنسبة لهذه المظاهرة ، تم استخدام Apple Vision Pro لالتقاط حركة يدي شخص ما. ثم تم استخدام هذه الحركة لمحاكاة التسجيل باستخدام الخدمات الصغيرة MimicGen NIM و Nvidia Isaac Sim ، والتي تنتج بيانات مصنعة.

يمكن للمطورين بعد ذلك تدريب نموذج الإنساني Project Groot مع مزيج من البيانات الحقيقية والاصطناعية. تعتبر هذه العملية مفيدة في تقليل التكلفة والوقت الذي يقضيه إنشاء البيانات من الصفر.

"إن تطوير روبوتات الإنسانية معقد للغاية - ويتطلب كميات هائلة من البيانات الحقيقية ، والتي يتم التقاطها بصعوبة من العالم الحقيقي" ، قال الرئيس التنفيذي لشركة Fourier لصناعة منصات الروبوت ، أليكس غو. "ستساعد أدوات تطوير الذكاء الاصطناعي التوليدية ومحاكاة جديدة من Nvidia على تسريع تدفق عمل تطوير نماذجنا."

يتم تقديم الخدمات الصغيرة ، بالإضافة إلى الوصول إلى النماذج ، وخدمات الروبوتات التي تديرها OSMO ، وغيرها من الإطارات في إطار برنامج مطوري الروبوتات الإنسانية Nvidia. يتم منح الوصول من قبل الشركة فقط لمطوري البرامج أو الأجهزة أو الشركات المصنعة للروبوتات الإنسانية.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)