بأقل من 50 دولاراً.. باحثون يبتكرون نموذج ذكاء اصطناعي استدلالي


الرياض - العربية Business 06/02/2025 03:20 PM

تمكن باحثو الذكاء الاصطناعي في جامعة ستانفورد وجامعة واشنطن من تدريب نموذج استدلال للذكاء الاصطناعي بأقل من 50 دولارًا في رصيد الحوسبة السحابية، وفقًا لورقة بحثية جديدة صدرت يوم الجمعة الماضي.

يعمل النموذج المعروف باسم s1 بشكل مشابه لنماذج الاستدلال المتطورة، مثل o1 من "OpenAI" وR1 من "ديب سيك" في اختبارات قياس قدرات الرياضيات والترميز.

يتوفر نموذج s1 على GitHub، إلى جانب البيانات والرمز المستخدم لتدريبه، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

قال الفريق وراء نموذج s1 إنهم بدأوا بنموذج أساسي جاهز، ثم قاموا بضبطه من خلال التقطير، وهي عملية لاستخراج قدرات الاستدلال" من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجاباته.

قال الباحثون إن s1 مستمدة من أحد نماذج التفكير المنطقي الخاصة بشركة غوغل، وهو Gemini 2.0 Flash Thinking Experimental.

والتقطير هو نفس النهج الذي استخدمه باحثو بيركلي لإنشاء نموذج تفكير منطقي للذكاء الاصطناعي مقابل حوالي 450 دولارًا في الشهر الماضي.

بالنسبة للبعض، فإن فكرة أن قِلة من الباحثين الذين لا يملكون ملايين الدولارات وراءهم لا يزالون قادرين على الابتكار في مجال الذكاء الاصطناعي مثيرة.

ومن غير المستغرب أن مختبرات الذكاء الاصطناعي الكبيرة ليست سعيدة بهذه الابتكارات.

اتهمت "OpenAI" شركة ديب سيك بحصاد البيانات بشكل غير صحيح من واجهة برمجة التطبيقات الخاصة بها لأغراض تقطير النموذج.

كان الباحثون وراء s1 يتطلعون إلى إيجاد أبسط نهج لتحقيق أداء قوي في التفكير والتوسع في وقت الاختبار، أو السماح لنموذج الذكاء الاصطناعي بالتفكير أكثر قبل الإجابة على سؤال.

كانت هذه بعض الاختراقات في o1 من OpenAI، والتي حاولت "ديب سيك" ومختبرات الذكاء الاصطناعي الأخرى تكرارها من خلال تقنيات مختلفة.

تشير ورقة s1 إلى أنه يمكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة نسبيًا باستخدام عملية تسمى الضبط الدقيق الخاضع للإشراف (SFT)، حيث يتم توجيه نموذج الذكاء الاصطناعي صراحةً لمحاكاة سلوكيات معينة في مجموعة بيانات.

تميل SFT إلى أن تكون أرخص من طريقة التعلم التعزيزي واسعة النطاق التي استخدمتها "ديب سيك" لتدريب منافسها على نموذجها o1 من "OpenAI".

تقدم "غوغل" وصولاً مجانيًا إلى Gemini 2.0 Flash Thinking Experimental، وإن كان ذلك مع حدود معدل يومية، عبر منصة Google AI Studio.

ومع ذلك، تحظر شروط "غوغل" إجراء هندسة عكسية لنماذجها لتطوير خدمات تتنافس مع عروض الذكاء الاصطناعي الخاصة بالشركة.

يعتمد S1 على نموذج ذكاء اصطناعي صغير جاهز للاستخدام من مختبر الذكاء الاصطناعي الصيني Qwen المملوك لشركة علي بابا، والذي يتوفر للتنزيل مجانًا.

تدريب بواسطة مجموعة صغيرة من البيانات

لتدريب s1، أنشأ الباحثون مجموعة بيانات مكونة من 1000 سؤال فقط تم اختيارها بعناية، مقترنة بإجابات على تلك الأسئلة، بالإضافة إلى عملية "التفكير" وراء كل إجابة من برنامج Gemini 2.0 Flash Thinking Experimental من "غوغل".

بعد تدريب s1، والذي استغرق أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية Nvidia H100، حقق s1 أداءً قويًا في معايير الذكاء الاصطناعي معينة، وفقًا للباحثين.

قال نيكلاس موينجوف، الباحث في جامعة ستانفورد الذي عمل في المشروع، إنه يمكنه استئجار الحوسبة اللازمة اليوم مقابل حوالي 20 دولارًا.

استخدم الباحثون خدعة ذكية لجعل s1 يعيد التحقق من عمله ويطيل وقت "تفكيره": لقد أخبروه بالانتظار.

ساعدت إضافة كلمة "انتظر" أثناء تفكير s1 النموذج على الوصول إلى إجابات أكثر دقة قليلاً، وفقًا للورقة البحثية.

تخطط "ميتا" و"غوغل" و"مايكروسوفت" لاستثمار مئات المليارات من الدولارات في البنية التحتية للذكاء الاصطناعي خلال عام 2025، والتي ستذهب جزئيًا نحو تدريب نماذج الذكاء الاصطناعي من الجيل التالي.


المصدر : alarabiya.net تاريخ النشر : 06/02/2025 03:20 PM

Min-Alakher.com ©2025®