يبدو أن جوجل ليست راضية عن سيطرتها على هذا العالم، وهي في طور توظيف موظفين جدد في مختبر أبحاث DeepMind لبناء نماذج توليدية قادرة على محاكاة العالم الفيزيائي. المشروع – الذي سيقوده تيم بروكس، أحد القادة الذين ساعدوا في بناء مولد الفيديو الخاص بـ OpenAI، سورا – سيكون جزءًا حاسمًا من محاولة الشركة لتحقيق الذكاء الاصطناعي العام، وفقًا لـ إعلانات الوظائف المتعلقة بالفريق الجديد.
انضم بروكس إلى DeepMind بعد ترك OpenAI في أكتوبر، وقد صرح هو وفريقه بأن لديهم “خطط طموحة لإنشاء نماذج توليدية ضخمة تحاكي العالم.” وفقًا لوصف الأدوار، سيساعد الجهد المبذول لبناء نماذج العالم في “توليد مجالات متعددة، مثل التفكير البصري والمحاكاة، والتخطيط لوكلاء جسديين، والترفيه التفاعلي في الوقت الحقيقي.” إذا كنت مستعدًا لتولي أحد هذه الأدوار، ربما يمكنك معرفة ما تعنيه هذه الغموض والعودة إلينا.
نموذج العالم، بعبارة بسيطة، يسعى عادةً لمحاكاة كيفية عمل العالم فعليًا. النماذج التوليدية مثل سورا قادرة على تكرار الأشياء التي رآها من قبل ضمن بيانات التدريب الخاصة بها، لكنها ليس لديها فهم حقيقي لسبب حدوث ذلك الشيء. لذا يمكنها بنجاح إنتاج فيديو لشخص يرمي كرة بيسبول، لكنها لا تفهم فيزيائيات ما يحدث. تهدف نماذج العالم إلى تزويد الآلة بما يكفي من المعلومات لتحليل كيفية حدوث فعل ما والنتيجة المحتملة لذلك.
وصف كبير علماء الذكاء الاصطناعي في ميتا، يان ليكون، نماذج العالم بهذه الطريقة خلال خطاب في منتدى هودسون في وقت سابق من هذا العام: “نموذج العالم هو نموذجك الذهني لكيفية تصرف العالم… يمكنك تخيل سلسلة من الأفعال التي قد تقوم بها، وسيسمح لك نموذج العالم الخاص بك بتوقع تأثير سلسلة الأفعال على العالم.”
نماذج العالم صعبة البناء لعدة أسباب، بما في ذلك الكمية الهائلة من الحوسبة اللازمة لتشغيل النموذج ونقص بيانات التدريب الكافية لإنشاء نموذج دقيق، مما يؤدي إلى عمل معظم نماذج العالم فقط في سياقات محدودة ومحددة.
يبدو أن فريق DeepMind مصمم على توسيع نموذج العالم. الخطة هي بناء أدوات “توليد تفاعلي في الوقت الحقيقي” على أساس النماذج، وربما النظر في كيفية دمج نموذجهم العالمي في نموذج جوجل الكبير للغة، جمنيا.
من المحتمل أن تكون إحدى المجالات التي ستحاول DeepMind التعامل معها هي ألعاب الفيديو. يلاحظ وصف الوظيفة للفريق الجديد أنهم سيتعاونون مع فرق Veo وGenie في جوجل. Genie هو مولد الفيديو الشبيه بسورا من جوجل وGenie هو نموذج عالمي موجود يمكنه محاكاة البيئات ثلاثية الأبعاد في الوقت الحقيقي. صناعة ألعاب الفيديو تتطلع بالفعل إلى تطبيق أدوات الذكاء الاصطناعي، مما يؤدي إلى استبدال آلاف العمال. وجدت دراسة من CVL Economics أن أكثر من 86% من جميع شركات الألعاب قد اعتمدت بالفعل أدوات الذكاء الاصطناعي التوليدية وأن حوالي 15% من جميع وظائف الألعاب قد تتعرض للاضطراب بحلول عام 2026.
ربما يكون تحسين هذا العالم استخدامًا أفضل للوقت بدلاً من نمذجته.