
طور الباحثون نظامًا ذكيًا اصطناعيًا يقوم بالعكس تمامًا مما يعنيه العيش في اللحظة. لكنه لا يفكر فقط بضع خطوات للأمام – بل يفكر في ملايين الخطوات للأمام.
قادت مجموعة من الباحثين برئاسة الرياضي سيرجي جوكوف من معهد كاليفورنيا للتكنولوجيا (كالتيك) لإنشاء نوع جديد من خوارزميات التعلم الآلي مصممة لحل المشكلات الرياضية التي تتطلب سلسلة طويلة للغاية من الخطوات. مثل سلسلة طويلة جدًا من الخطوات؛ نحن نتحدث عن مليون خطوة أو أكثر.
بشكل محدد، تمكن الذكاء الاصطناعي من تحقيق تقدم في مشكلة معقدة تُعرف ب فرضية أندروز-كورتيس، التي حيرت الرياضيين لعقود. تسأل هذه الفرضية بشكل أساسي: هل يمكن دائمًا حل بعض الألغاز الرياضية باستخدام مجموعة من الحركات المسموح بها، مثل إعادة ترتيب الخطوات أو التراجع عنها؟
في هذا السياق، سعت البرنامج الجديد في كالتيك إلى “العثور على تسلسلات طويلة من الخطوات نادرة وصعبة الاكتشاف”، كما قال علي شهبير، المؤلف الأول للدراسة ورياضياتي في جامعة روتجرز، في بيان صادر عن كالتيك. “إنها مثل محاولة العثور على طريقك عبر متاهة بحجم الأرض. هذه هي طرق طويلة جدًا عليك اختبارها، وهناك طريق واحد فقط يعمل.”
في دراسة مسبقة تم نشرها على arXiv في أغسطس الماضي وتم تحديثها يوم الثلاثاء، قام شهبير وزملاؤه بتفصيل كيفية استخدامهم للذكاء الاصطناعي الذي طوروه حديثًا لحل عائلات من المشكلات المتعلقة بفرضية أندروز-كورتيس، التي تتضمن الجبر التجريدي. للتوضيح، لم يحلوا الفرضية نفسها. وعلى الرغم من أن ذلك قد يبدو غير مثير، إلا أن الباحثين أثبتوا عدم صحة بعض الأمثلة المضادة الجارية للفرضية. وعلى الرغم من أن نفي الأمثلة المضادة لا يجعل الفرضية الأصلية صحيحة بالضرورة، إلا أنه يعززها.
“استبعاد بعض الأمثلة المضادة يمنحنا الثقة في صحة الفرضية الأصلية ويساعد في بناء حدسنا حول المشكلة الرئيسية،” أوضح شهبير. “إنه يمنحنا طرقًا جديدة للتفكير فيها.” قارن جوكوف المشكلات الرياضية بمكعب روبيك.
“هل يمكنك أخذ هذا المكعب الروبيك المعقد والمخربط وإعادته إلى حالته الأصلية؟ عليك اختبار هذه التسلسلات الطويلة من الحركات، ولن تعرف إذا كنت على الطريق الصحيح حتى النهاية،” أوضح.
فكيف يقوم الذكاء الاصطناعي بذلك؟ ببساطة، من خلال التفكير خارج الصندوق. اتباعًا لنهج التعلم بالتعزيز، قام الباحثون بتدريب الذكاء الاصطناعي من خلال تغذيته أولاً بمشكلات رياضية سهلة تليها مهام تزداد صعوبة. “إنه يجرب حركات متنوعة ويكافأ على حل المشكلات،” قال شهبير. “نحن نشجع البرنامج على القيام بمزيد من نفس الشيء مع الحفاظ على مستوى معين من الفضول. في النهاية، يطور استراتيجيات جديدة أفضل مما يمكن أن يفعله البشر. هذه هي سحر التعلم بالتعزيز.”
تعلمت الخوارزمية في النهاية توليد تسلسلات طويلة من الحركات غير المتوقعة، والتي أطلق عليها الباحثون اسم “الحركات الخارقة”. بالمقابل، فإن مخرجات ChatGPT مملة جدًا.
“إذا طلبت من ChatGPT كتابة رسالة، فسوف يقدم شيئًا تقليديًا. من غير المحتمل أن يأتي بشيء فريد وأصلي للغاية. إنه ببغاء جيد،” قال جوكوف. “برنامجنا جيد في ابتكار الاستثناءات.”
يمكنني التفكير في حدث استثنائي واحد على الأقل سيكون مريحًا جدًا للذكاء الاصطناعي للتنبؤ به: الانهيارات المالية. ولكن بينما لم تحقق برامج التعلم الآلي الحالية هذا المستوى من التنبؤ المتقن، يتكهن الباحثون بأن طرقهم قد تساهم يومًا ما في نوع من التنبؤ الذكي.
“ببساطة، برنامجنا يعرف كيف يتعلم أن يتعلم،” أوضح جوكوف. “إنه يفكر خارج الصندوق.” وأضاف أن الفريق حقق تحسينات كبيرة في مجال الرياضيات الذي كان قديمًا لعقود. علاوة على ذلك، أعطى جوكوف وزملاؤه الأولوية لأساليب لا تحتاج إلى كميات كبيرة من قوة الحوسبة، مما يجعل عملهم متاحًا لأكاديميين آخرين لديهم حواسيب صغيرة.
على الرغم من أن التطبيقات العملية لهذا الإنجاز قد لا تكون واضحة في حياتنا اليومية، إلا أن عملهم ينضم إلى مجموعة من الباحثين الآخرين الذين يقومون بتحسين خوارزميات التعلم الآلي لحل مشكلات الإنسانية (وليس لتدمير حضارتنا).