أبل تطلق نموذج SHARP مفتوح المصدر ، يمكن أن يكون صور 2D عرض 3D في لحظة
جاكرتا - عادت شركة أبل إلى جعل مجتمع التكنولوجيا يرفع الحاجبين ، هذه المرة ليس من خلال iPhone أو Mac ، ولكن من خلال أبحاث الذكاء الاصطناعي المفتوحة المصدر. أصدرت الشركة نموذجا يدعى SHARP ، وهي تقنية قادرة على تحويل صورة 2D إلى عرض 3D واقعي في أقل من ثانية واحدة.
تم عرض هذا النموذج في دراسة بعنوان "تجميع الرؤية أحادية العين الحادة في أقل من ثانية". إنها بسيطة ولكن تأثيرها كبير: من صورة ثابتة واحدة ، يمكن ل SHARP إعادة إنشاء تمثيل لقطة 3D ذات مقياس ومسافة متسقة بشكل ملحوظ ، وليس مجرد وهم بصري.
يعمل هذا بالاعتماد على ما يسمى بتمثيل غاوسي ثلاثي الأبعاد. ببساطة، هذه هي الملايين من "البلوعات" الصغيرة التي تحتوي على معلومات عن الألوان والضوء والتي يتم وضعها في الفضاء ثلاثي الأبعاد. عندما يتم دمجها، فإن هذه الكتل تصلح مشهد يمكن رؤيته من زوايا مختلفة، طالما أنها لا تزال قريبة من موضع الكاميرا الأصلي.
ما يجعل SHARP بارزًا هو كفاءته. عادة ما تتطلب الطرق السابقة لقطر غاوسي عشرات إلى مئات الصور من زوايا مختلفة لبناء مشهد ثلاثي الأبعاد. يحتاج SHARP إلى صورة واحدة فقط ، يتم معالجتها في تمرير عابر واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد واحد و یا یک طرفه و یا دو طرفه و یا سه طرفه و یا چهار طرفه و یا پنج طرفه و یا شش طرفه و یا هفت طرفه و یا هشت طرفه و یا نه طرفه و یا ده طرفه و یا دوازده طرفه و یا سیزده طرفه و یا چهارده طرفه و یا پانزده طرفه و یا شانزده
Apple تدرب SHARP على استخدام مزيج من البيانات التكيفية والواقعية على نطاق كبير. ونتيجة لذلك ، تمكن هذا النموذج من التكهن بعمق ، وتحسينه مع أنماط هندسية تم تعليمه ، ثم التنبؤ مباشرة بموقع ومظهر ملايين من الغازي 3D. وكل ذلك يتم دون عملية تحسين بطيئة لكل مشهد.
من حيث الأداء ، تزعم شركة Apple أن SHARP حققت قفزة كبيرة. يقال إن هذا النموذج يقلل الخطأ البصري بشكل كبير مقارنة بالأساليب الأفضل السابقة ، وفي الوقت نفسه يقلل وقت التوليف إلى آلاف المرات أسرع. باختصار ، أسرع وأكثر استقرارا وأكثر واقعية.
هناك تنازل متعمد. تركز SHARP على إعادة عرض الزاوية التي لا تزال قريبة من الصورة الأصلية ، بدلاً من إنشاء أجزاء من المشهد التي كانت غير مرئية تمامًا من قبل. لا يمكن للمستخدم "السفر بعيدًا" حول الكائن مثل لعبة عالم مفتوح. هذه القيود هي في الواقع مفتاح السبب في أن SHARP يمكن أن تكون سريعة للغاية وتظل تبدو منطقية.
وهو ما يثير الاهتمام، لا تحتفظ أبل بهذه التقنية بشكل وثيق، حيث تم إصدار SHARP كبرنامج مفتوح المصدر على GitHub، وبدأ المجتمع التجريب على الفور. في غضون أيام، كان المستخدمون بالفعل يحاولون تطبيقها على مقاطع الفيديو، والتصور الغاوثاني 4D، إلى تجارب إبداعية خارج سيناريو أبل الأصلي.
الخطوة هذه تظهر الجانب النادر من أبل الذي لا يتم تسليط الضوء عليه على نطاق واسع: العدوانية في الأبحاث الأساسية للذكاء الاصطناعي والثقة الكافية لفتح نتائجها للعالم. قد لا تكون SHARP ميزة iOS في صباح الغد ، لكنها توفر نظرة عامة على الاتجاه الذي يتجه إليه مستقبل محتوى Apple المرئي والواقع المعزز والحوسبة المكانية.
واحد: صورة واحدة ، لذا فهي مساحة ثلاثية الأبعاد ، في لحظة تقريبا. إذا كان هذا مجرد بحث ، فإن المنتج في النهاية سيجعل من المحتمل أن يجعل الصناعة الأخرى تلمس رأسها.