أنشرها:

جاكرتا - في ورقة بحثية حديثة ، أعادت Apple تأكيد ادعاءها بأن نموذج الذكاء الخاص بها ، Apple Intelligence ، لا يتم تدريبه على استخدام البيانات المأخوذة بشكل غير قانوني من الإنترنت.

جاكرتا - في عصر تجمع فيه العديد من أنظمة الذكاء الاصطناعي (الذكاء الاصطناعي) بيانات على نطاق واسع من جميع أنحاء الويب ، أكدت Apple أنها تمتثل للأخلاقيات في عملية تدريب النماذج الخاصة بها.

في عام 2023 ، واجهت شركات كبيرة مثل OpenAI و Microsoft دعوى قضائية من صحيفة نيويورك تايمز بتهمة انتهاك حقوق الطبع والنشر المتعلقة بجمع البيانات دون تصاريح.

على عكس هذه الممارسة الشائعة ، يقال إن Apple سعت في عام 2023 إلى شراء حقوق الترخيص من ناشري الكبار مثل Conde Nast و NBC News لاستخدام أعمالهم في تدريب نماذج اللغة الطويلة /LLM. وبحسب ما ورد عرضت Apple ملايين الدولارات ، على الرغم من أنه في ذلك الوقت لم يتضح بعد من الذي وافق فيه الناشر أو رفضه.

في ورقة بحثها المنشورة حديثا ، أوضحت Apple أنها لن تصل إلى البيانات من الناشرين الذين لا يقدمون أذونات أو تأخذها.

"نحن نؤمن بتدريب النماذج باستخدام بيانات متنوعة وعالية الجودة. وتشمل هذه البيانات التي نترخيصها من الناشرين ، والبيانات المنسقة من بيانات المصدر المفتوح أو المتاحة للجمهور ، بالإضافة إلى المعلومات التي حصلت عليها Applebot ، وشوائب الويب الخاصة بنا ، "قالت Apple على مدونتها.

كما أكدت آبل أنها لا تستخدم بيانات المستخدم الشخصية أو تفاعلات المستخدم عند تدريب نموذج الأساس الخاص بها. تتخذ الشركة خطوات مختلفة لتصفية المعلومات الشخصية وحذفها، فضلا عن تجنب المواد غير اللائقة أو الضارة.

توضح معظم الأوراق كيف تعمل Applebot على استرداد البيانات ذات الصلة والجودة من الإنترنت المليء ب "الضوضاء" (البيانات غير الصالحة أو غير المرغوب فيها). ومع ذلك ، تؤكد Apple أيضا على التزامها بحقوق الطبع والنشر والأخلاق ، من خلال اتباع بروتوكولات robots.txt التي تستخدمها مواقع الويب بشكل شائع.

يسمح بروتوكول robots.txt للناشرين بتحديد الصفحات أو أجزاء الموقع التي لا يسمح لجواسيس الويب بالوصول إليها ، بما في ذلك تلك المستخدمة لتدريب نماذج الذكاء الاصطناعي. تقول Apple إنها تحترم هذه القاعدة ، مما يوفر للناشرين تحكما مفصلا في المحتوى الذي يمكن أن يصل إليه Applebot ، مع الاستمرار في عرض هذه الصفحات في نتائج بحث Siri و Spotlight.

من ناحية أخرى ، فإن العديد من شركات الذكاء الاصطناعي الأخرى ، مثل OpenAI ، على الرغم من أنها تدعي أنها تتبع المعايير الأخلاقية ، لا تضمن صراحة الامتثال ل robots.txt. وفقا لشركة تحليل السوق TollBit ، في الربع الأول من عام 2025 ، كان هناك حوالي 13٪ من نشاط التقاط البيانات (scraping) من قبل شركات الذكاء الاصطناعي التي تتجاهل قواعد robots.txt ، بزيادة عن 3.3٪ في الربع الأخير من عام 2024.

من المحتمل أن يكون هذا بسبب سرقة العديد من الإنترنت المتاح حتى تستمر الشركة في العملية. حتى في يونيو 2025 ، قضت محكمة محلية أمريكية بأن أخذ البيانات لتدريب الذكاء الاصطناعي قانوني.

يتحدد كل مجنح ويب ، بما في ذلك Applebot ، نفسه عند الوصول إلى الموقع. إذا كان موقعا غير معروف على Applebot ، فسيتبع Applebot القواعد المطبقة على Googlebot كمعيار بديل.

قامت العديد من الناشرين الرئيسيين مثل بي بي سي بحظر الوصول إلى الذكاء الاصطناعي مثل OpenAI و Common Crawl على مواقعهم. وجدت دراسة شملت 1,156 ناشرا للأخبار أن 626 منهم منعوا أخذ البيانات بواسطة الذكاء الاصطناعي.

هناك أيضا حالات مثل Perplexity.ai ، والتي من المتوقع أن تشتريها Apple ، والتي تدعي أيضا أنها الذكاء الاصطناعي الأخلاقي. ومع ذلك ، تم اتهام Perplexity ذات مرة بالاستمرار في أخذ البيانات دون إذن ويعترف الرئيس التنفيذي بأن نظامهم ليس مثاليا بعد.

بشكل عام ، حتى الآن ، لم تتهم Apple قانونيا أبدا بانتهاك الأخلاق أو حقوق الطبع والنشر في تدريب الذكاء الاصطناعي الخاص بها. هذا يختلف عن OpenAI و Microsoft اللذين واجهتا بالفعل دعاوى قضائية ، أو التعقيد الذي تم انتقاده.

ومع ذلك ، فإن هذا لا يعني أن الناشرين راضون تماما عن تدريب نماذج اللغات الكبيرة باستخدام بياناتهم ، ولكن حتى الآن يبدو أن Apple هي الشركة الوحيدة التي تجري باستمرار تدريبا الذكاء الاصطناعي بشكل قانوني وأخلاقي.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)