المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
نشر معهد ماساتشوستس للتكنولوجيا مؤخرا ورقة تشرح بهدوء لماذا يصطدم منطق ماجستير اللغة الكبيرة بالجدار وكيفية تجاوزه.
القصة المعتادة هي أن النماذج تفشل في المشكلات الصعبة لأنها تفتقر إلى الحجم أو البيانات أو الذكاء.
تجادل هذه الورقة بشيء أكثر هيكلية: النماذج تتوقف عن التحسن لأن إشارة التعلم تختفي. عندما تصبح المهمة صعبة جدا، تنهار معدلات النجاح نحو الصفر، ولا يكون هناك ما يتحسين، ويتوقف التفكير في التفكير. الفشل ليس معرفيا، بل تربوي.
يقترح المؤلفون إعادة صياغة بسيطة لكنها جذرية. بدلا من السؤال عن كيفية جعل النماذج تحل مشاكل أصعب، يسألون كيف يمكن للنماذج توليد مشاكل تعلمها.
نظامهم، SOAR، يقسم نموذجا واحدا مدربا مسبقا إلى دورين: طالب يحاول تنفيذ مهام صعبة للغاية، ومعلم يولد مشاكل تدريبية جديدة. المشكلة هي أن المعلم لا يكافأ على طرح أسئلة ذكية أو واقعية. يكافأ فقط إذا تحسن أداء الطالب في مجموعة ثابتة من مسائل التقييم الحقيقية. عدم وجود تحسن يعني صفر مكافأة.
هذا الحافز يعيد تشكيل كل شيء.
يتعلم المعلم توليد مسائل متوسطة ومرحلة انتقالية تقع ضمن حدود قدرة الطالب الحالية. هذه المشاكل ليست نسخا مبسطة من المهمة المستهدفة، والأكثر لافتة أنها لا تتطلب حتى حلولا صحيحة.
ما يهم هو أن هيكلها يجبر الطالب على ممارسة نوع الاستدلال الصحيح، مما يسمح بظهور إشارة تدرج حتى عندما يفشل الإشراف المباشر.
النتائج التجريبية توضح النقطة بشكل مؤلم. في اختبارات الأداء حيث تبدأ النماذج بدون نجاح وتعلم التعزيز القياسي بشكل كامل، يكسر SOAR الجمود ويحسن الأداء بشكل مستمر.
النموذج يخرج من حافة قابلية التعلم ليس بالتفكير العميق، بل ببناء بيئة تعلم أفضل لنفسه.
الدلالة الأعمق غير مريحة. العديد من "حدود التفكير" المفترضة قد لا تكون حدودا للذكاء على الإطلاق. هي آثار لأنظمة تدريب تفترض أن العالم يوفر مشكلات قابلة للتعلم مجانا.
تشير هذه الورقة إلى أنه إذا استطاعت النماذج تشكيل منهجها الخاص، فإن هضبات التفكير تصبح مشاكل هندسية وليست حواجز أساسية.
لا هياكل جديدة، ولا بيانات بشرية إضافية، ولا نماذج أكبر. مجرد تحول في ما نكافئه: التقدم في التعلم بدلا من الإجابات.

الأفضل
المُتصدِّرة
التطبيقات المفضلة
