يقول المثل القديم إنه يجب عليك عدم شراء الجيل الأول من أي تقنية جديدة. انتظر حتى يقوم المطورون بإصلاح العيوب، ثم تحقق مرة أخرى. نحن الآن في عامين من “ثورة” الذكاء الاصطناعي، ونجرف إلى الثالث. يجب أن يكون الذكاء الاصطناعي هو الشيء الكبير التالي بالفعل؛ يجب أن تكون المشاكل قد تم تسويتها، ويجب أن تتناسب قطع اللغز جميعها. لكنه لم يصل إلى هناك بعد. كان هذا العام كبيرًا في مجال الذكاء الاصطناعي، ولكن العام المقبل سيظهر الوعد الحقيقي للذكاء الاصطناعي على الأجهزة. أين سمعنا ذلك من قبل؟
لم يحقق الذكاء الاصطناعي الكثير من الوعود التي قدمتها شركات التكنولوجيا، الكبيرة والصغيرة. في عام 2024، كانت الأجهزة المخصصة للذكاء الاصطناعي قد فشلت في تقديم ما كان متوقعًا. لم يترك الذكاء الاصطناعي على جهاز ماك أو بي سي انطباعًا قويًا أيضًا. لم يكن هناك موجة من تطبيقات الذكاء الاصطناعي التي تستخدم المعالجات العصبية الجديدة في أجهزة اللابتوب، وتعتمد معظم التطبيقات على الحوسبة السحابية. يبدو أن التطبيقات الرئيسية للذكاء الاصطناعي هي تقنيات البرمجة التي تجد طرقًا لتدمير صناعتها. بخلاف ذلك، يستخدم المحتالون الذكاء الاصطناعي لملء الإنترنت بالزيف والقمامة. يدفع الذكاء الاصطناعي على الأجهزة المستهلكين العاديين لكتابة أو تلخيص الرسائل الإلكترونية باستخدام الذكاء الاصطناعي. هذا لا يبدو بالضبط وكأنه تطبيق الذكاء الاصطناعي القاتل.
لهذا السبب تدفع شركات التكنولوجيا الكبرى الآن نحو الذكاء الاصطناعي “الوكيل”. تعد الشركات أن نماذج اللغة الكبيرة ستقوم بكل عملك المرهق بسلاسة ودون تدخل. ربما، مع الوكلاء، يمكن أن يصبح الذكاء الاصطناعي حقيقيًا في عام 2025. لقد رأينا فقط بعض العروض التوضيحية حول كيفية عمل هذا الذكاء الاصطناعي. تظهر الاستطلاعات أن ميزات الذكاء الاصطناعي الحالية لا تثير حماس مستخدمي آبل وأندرويد. في جوهرها، تحتاج شركات التكنولوجيا الكبرى إلى الذكاء الاصطناعي الوكيل ليحقق النجاح. بدونه، سيتساءل المستخدمون العاديون عن سبب كل هذا الضجيج. لا نعرف كيف ستعمل هذه الوكلاء الذكية العام المقبل، لكننا نعرف تمامًا كيف ستدفع وادي السيليكون ذلك للمستخدمين، سواء أردنا ذلك أم لا.
لا أحد قد تمكن من اختراق الذكاء الاصطناعي القابل للارتداء
هذا العام قدم لنا مجموعة من الأجهزة القابلة للارتداء المحمولة التي تعتمد على الذكاء الاصطناعي، مثل Humane AI Pin و Rabbit R1. أُطلقت كلا الجهازين في وقت مبكر جدًا، مع برامج غير واضحة توفر في الواقع وصولًا سريعًا إلى دردشة الذكاء الاصطناعي مثل ChatGPT.
كانت هناك انهيارات من المنتجات السيئة لدرجة أننا لم نتمكن من تغطية كل شيء. لقد استخدمت محول Timekettle X1، وهو جهاز ترجمة بحجم الجيب يروج لقدرته على الترجمة باستخدام الذكاء الاصطناعي. كان بإمكانه الحفاظ على حواره بين الإنجليزية والإسبانية في اختباراتنا. ومع ذلك، فإن محاولة الترجمة من الإنجليزية إلى الأوردو كانت تؤدي إلى إدخال أسماء مشاهير باكستانيين عشوائيين أو إشارات إلى الله في منتصف الترجمة. كان الأمر مهينًا ومضحكًا بنفس القدر لزميلي المتحدث بالأوردو. كان أداؤه أسوأ في بعض اللغات الأخرى مقارنة بتطبيق جوجل للترجمة.
ولم تكن فقط العلامات التجارية الأصغر غير قادرة على تحقيق كامل وعود الذكاء الاصطناعي الخاص بالأجهزة. كانت ميزات التعرف على الصور للذكاء الاصطناعي في نظارات Ray-Ban من ميتا تواجه أحيانًا صعوبة في فهم ما هو أمامها. على الأقل، لا تزال تلك النظارات قادرة على التقاط الصور دون الحاجة إلى الذكاء الاصطناعي القائم على السحابة، وهو ما لا تستطيع بعض الأجهزة الأخرى القيام به. لم يفِ Humane AI Pin ذو السعر 700 دولار بوعوده العالية. أشار المراجعون إلى أنه غالبًا ما يفشل في التعرف على الأشياء أمامه بشكل صحيح، وحتى عندما كان دقيقًا، كان يعاني من ضعف عمر البطارية ومشكلات في الحرارة. قامت Humane لاحقًا باستدعاء حزمة الشحن بسبب مخاوف من مخاطر الحريق. كان يُقدَّر في السابق بحوالي 850 مليون دولار، وقد شهدت الشركة أنها شهدت المزيد من عمليات الإرجاع مقارنة بالمبيعات حتى منتصف العام.
تم سحق وعد الذكاء الاصطناعي الخاص بالأجهزة مرة بعد مرة. أُطلق Rabbit R1 بعد بضعة أسابيع من Humane Pin. قارن الرئيس التنفيذي جيسي ليو جهازه الذي يبلغ قيمته 200 دولار مع منافسيه وادعى أن “نظام التشغيل الشخصي” و”نموذج العمل الكبير” الخاص به سيكون مساعد الذكاء الاصطناعي الحقيقي الخاص بك. كانت الإطلاق كارثة. فتح المستخدمون بسرعة LAM ووجدوا أن نظام التشغيل القائم على أندرويد يمكن أن يعمل على الهواتف. تم تسهيل معظم قدراته من خلال السحابة. كان يمكن للجهاز أيضًا الاتصال ببعض التطبيقات الخارجية، لكن قراصنة القبعة البيضاء والمطورين وجدوا أنهم يمكنهم الوصول إلى بيانات المستخدم المتاحة أيضًا لموظفي Rabbit الداخليين.
كان هناك المزيد من الأجهزة التي تركز على الذكاء الاصطناعي، مثل Plaud NotePin، الذي يقدم نسخًا مكتوبة وتدوين ملاحظات مبني على الذكاء الاصطناعي. إنه يعمل بفضل استخدام محدود. لا محالة، ستتساءل عما إذا كان جهازك الحالي يمكنه التعامل مع نفس القدرات. تمتلك جوجل تطبيق Pixel Recorder، ولدى آيفون وماك مذكرات صوتية مع قدرات النسخ.
لصالحهم، حاول مطورو الأجهزة الذكية تحسين أجهزتهم. في نوفمبر، قامت Rabbit بتحديث نظام التشغيل الخاص بها للسماح بـ”وكلاء الذكاء الاصطناعي المخصصين” مع وضع التعليم. كان ذلك وعدًا أساسيًا مع LAM قبل نصف عام. لا يزال الوضع في المرحلة التجريبية، لكن المشكلة تبقى أن الجهاز لا يمتلك وصولًا مباشرًا إلى التطبيقات التي تريد استخدامها.
في ديسمبر، بدأت Humane بـالترويج لنظامها CosmOS، “المبني من الألف إلى الياء للذكاء الاصطناعي”، إلى أجهزة خارج AI Pin. يريدون وضعه في السيارات، واستخدامه لتقنية المنزل الذكي، وحتى تثبيته في التلفاز الخاص بك لتحليل الأحداث على الشاشة. سيعمل “المدير الذكي” بشكل أساسي مثل أي عرض آخر للذكاء الاصطناعي الوكيل، حيث يتعمق في أجهزتك ومعلوماتك لأداء المهام نيابة عنك.
كان الانتقال من “جهاز الذكاء الاصطناعي” إلى “جهاز الذكاء الاصطناعي الوكيل” سلسًا. فشلت وعود هذه الأجهزة في التأثير، لكنهم الآن يستخدمون نفس استراتيجية الضجة حول الذكاء الاصطناعي الوكيل. نتوقع المزيد من هذه الأنواع من الأجهزة في CES 2025 الشهر المقبل. سيستخدمون نفس اللغة لـ”مساعد الذكاء الاصطناعي”، لكن ستكون بنكهة الوكيل الجديدة لهذا الأسبوع. لا يزال الأمر غير واضح إذا كانت هذه الأجهزة ستكون جيدة، لكن الأمر يبدو غير مشجع إذا لم تتمكن هذه الأجهزة من معرفة شيء لا يفعله هاتفك بالفعل.
لم يتحقق “الذكاء الاصطناعي للكمبيوتر الشخصي” بعد
ضغط صانعو الرقائق مثل إنتل وكوالكوم على النقطة بشأن معالجاتهم العصبية أو NPUs. كانت هذه هي القصة مع شرائح كوالكوم Snapdragon X Elite وX Plus. أطلقت مايكروسوفت على أي كمبيوتر شخصي يعمل بشريحة ARM من كوالكوم، لقب “الكمبيوتر الشخصي Copilot+”. تُركت جميع تلك “الكمبيوترات الشخصية الذكية” مع Meteor Lake الخاصة بإنتل في البرد.
جلست أمام إنتل في يناير وسألت أحد كبار نواب الرئيس في الشركة، ساشين كاتي، عما إذا كانت الدفعة الأولية من “الكمبيوترات الشخصية الذكية” قادرة حقًا على تشغيل الذكاء الاصطناعي على الأجهزة. نعم، يمكنها، أخبرني. كانت المشكلة الوحيدة هي نقص التطبيقات. للمرة الأولى في تاريخ التكنولوجيا، تجاوزت التكنولوجيا التطبيقات المتاحة. كان الأمر متروكًا للمطورين للوفاء بالطلب، كما قال.
كانت أكبر تطبيقات الذكاء الاصطناعي في عام 2024 هي روبوتات الدردشة – مثل Perplexity وClaude وChatGPT وأكثر – والتي لم تتطلب أي معالجة للذكاء الاصطناعي على الأجهزة. ثم جاء Copilot+. كانت هذه النقطة التحول للشرائح المعتمدة على ARM في الكمبيوتر الشخصي مع شرائح كوالكوم Snapdragon X Elite وX Plus الجديدة. كان لكل شريحة NPU قادرة على 45 TOPS، أو تريليونات العمليات في الثانية (قيمة مشتقة يُمكن القول إنها ليست مثالية لوصف قدرات الذكاء الاصطناعي). لم تلب أي من تلك الشرائح السابقة من إنتل المتطلبات اللازمة لتكون Copilot+. لن يكون الأمر حتى نقطة Strix من AMD وLunar Lake من إنتل بعد عدة أشهر حتى يتمكن فريق Blue وفريق Red من المطالبة بلقب Copilot+ المطلوب.
استخدام تلك الميزات كان مسألة أخرى. شحنت أجهزة الكمبيوتر الجديدة بزر Copilot للوصول الفوري إلى روبوت الدردشة المفضل لدى مايكروسوفت. ومع ذلك، كانت الميزات الوحيدة للذكاء الاصطناعي على الجهاز التي تم تضمينها هي بعض مولدات الصور الذكية والعناوين التلقائية في مكالمات الفيديو أو في الفيديوهات. كانت ميزة الذكاء الاصطناعي الرئيسية لمايكروسوفت، Recall، من المفترض أن تمنح جهاز الكمبيوتر الخاص بك “ذاكرة فوتوغرافية” من خلال التقاط كل ما فعلته ثم نسخه باستخدام الذكاء الاصطناعي.
أجلت مايكروسوفت الميزة قبل أن تخطط العديد من الشركات المصنعة لإصدار أول دفعة من أجهزة الكمبيوتر المحمولة الخاصة بها. أثبت الباحثون الأمنيون أن نسخ الشاشة يمكن الوصول إليها دون أي طبقة أمان حقيقية. سمحت مايكروسوفت فقط لمختبري بيتا الخاصين بنظام ويندوز 11 بالوصول إلى الميزة في نوفمبر. بناءً على أحدث إصدار تجريبي، لا يزال Recall يتطلب بعض الضبط الدقيق. إنه يعمل. إذا كنت موافقًا على التقاط لقطات من حياتك وبعض المعلومات الحساسة المحتملة، فهو مفيد لأولئك الذين لديهم ذاكرة ضعيفة.
ثم تصل إلى آبل، وقد وصلت الميزات الحالية للذكاء الاصطناعي متأخرة جدًا في عام 2024 لدرجة أن من الأفضل لو تم تأجيلها جميعًا حتى عام 2025. وصل الإصدار المستقر الأخير من macOS Sequoia 15.2 في ديسمبر، bringing the Image Playground and ChatGPT integration with Siri to Macs. على الأقل، تحتاج فقط إلى جهاز Mac من سلسلة M للوصول إلى هذه الميزات، على عكس آيفون، الذي يتطلب طراز iPhone 15 Pro أو iPhone 16.
إذا كان لديك جهاز آبل قديم، فلن تفوت شيئًا. يخلق Image Playground صورًا كرتونية لك أو لأصدقائك بوجوه تبدو وكأنها مزيج بين فنان كاريكاتير كسول ووضع الرأس الكبير في لعبة فيديو قديمة. يوفر تكامل ChatGPT القليل من أكثر من مجرد بحث جوجل المعتاد. كما أنه يجعل من الصعب العثور على المحادثات السابقة من خلال الويدجت المدمج، الذي أصبح الآن بارزًا في شريط الأدوات العلوي.
يمكن لمعالجات NPU لهذه الأجهزة تشغيل مهام الذكاء الاصطناعي البسيطة أو الخلفية فقط. بالنسبة لمهام الذكاء الاصطناعي الأكثر تعقيدًا، مثل تشغيل النماذج العليا المدعومة من قبل هذه الشركات، تحتاج إلى وحدة معالجة الرسومات (GPU). يمكن لوحدة معالجة الرسومات Nvidia GeForce RTX 4090 القيام بأكثر من 1,300 TOPS، أي 26 مرة مما يمكن أن تفعله وحدات NPU المتقدمة اليوم. في ديسمبر، أطلقت Nvidia وحدة Orin Nano بسعر 250 دولارًا، والتي تم بناؤها خصيصًا لتشغيل تطبيقات الذكاء الاصطناعي محليًا. يعد المعالج بـ67 TOPS.
بينما يواجه الذكاء الاصطناعي “الجدار”، يحتاج الذكاء الاصطناعي الوكيل إلى ملء الفراغ
النماذج الأحدث والأفضل من Gemini متاحة لمالكي Chromebook Plus الجدد، لذلك أصبحت على دراية بذكاء جوجل الاصطناعي على الأجهزة، حتى خارج الهواتف. في ديسمبر، أصدرت جوجل Gemini 2.0، الوضع المتقدم لمشتركي Gemini Advanced. سيتعين عليك أن تكون مستخدمًا مخلصًا جدًا لتلاحظ الفرق بين النماذج. يجب أن يكون للإصدار الجديد قدرة أفضل على البرمجة واللغة، لكن إذا كنت تستخدمه فقط للنص، فإن الفرق هو أن 2.0 Pro سيكون أكثر تفصيلًا من 1.5 Pro.
سبب كبير يجعل الذكاء الاصطناعي يصبح “وكيلًا” هو “الجدار”. في دوائر الذكاء الاصطناعي، هو المصطلح العام لكيفية تقديم المزيد من بيانات التدريب للذكاء الاصطناعي يؤدي إلى عوائد متناقصة. قال إيليا سوتسكيڤر، أحد مؤسسي OpenAI، الذي لم يكن يتجنب الكلمات بشأن صاحب العمل السابق، لجمهور في مؤتمر في فانكوفر إن مطوري الذكاء الاصطناعي ينفد منهم البيانات لتدريب نماذج الذكاء الاصطناعي، قائلًا، “علينا التعامل مع البيانات التي لدينا. هناك إنترنت واحد فقط.” لا يعني هذا أن نماذج الذكاء الاصطناعي لا يمكن أن تتحسن. قال سوتسكيڤر، الذي أصبح الآن مؤسسًا مشاركًا لشركة AI Labs، سابقًا لـرويترز إن عصر “القياس” قد انتهى والآن هو وقت “الاكتشاف”.
تم تصميم نماذج أحدث، مثل نموذج GPT-o1 من OpenAI، مع مراعاة قدرة أفضل على الاستدلال. لكن المعايير الأفضل لا تؤدي بالضرورة إلى نتائج أفضل للمستخدم العادي. إذا لم تكن معجبًا بالفعل بنماذج الذكاء الاصطناعي الحالية، فمن المحتمل ألا تكون معجبًا بإصدارات العام المقبل الكبيرة. لهذا السبب تقوم OpenAI بـالترويج لوكلاء Altera AI، وتقارير تشير إلى أن شركة سام التمان الكبرى للذكاء الاصطناعي ستطلق وكيلًا ذكائيًا مستقلًا يحمل الاسم الرمزي “المشغل”.
لهذا السبب يجب أن تنطلق الوكلاء. قدمت Anthropic، صانعة Claude، لنا لمحة عما يتطلبه ذلك في عرض توضيحي تم إصداره في أكتوبر. تظهر العروض كيف يمكن للمستخدمين أن يطلبوا من Claude 3.5 Sonnet الوصول إلى جوجل كروم، وكتابة بحث على جوجل، ثم إضافة حدث إلى تقويم المستخدمين.
نحن نجرب شيئًا جديدًا تمامًا.
بدلاً من صنع أدوات محددة لمساعدة Claude في إكمال المهام الفردية، نحن نعلمه مهارات الكمبيوتر العامة – مما يسمح له باستخدام مجموعة واسعة من الأدوات القياسية والبرامج المصممة للناس. pic.twitter.com/42u8VeTvXd
— Anthropic (@AnthropicAI) 22 أكتوبر 2024
إنها عرض توضيحي مسلٍ، على الرغم من أنك تقدم للذكاء الاصطناعي نظرة عميقة في حياتك الشخصية. أشارت Anthropic إلى أن الذكاء الاصطناعي أوقف تسجيل الشاشة الخاص بالشركة في نقطة معينة، وكان ذلك بمفرده. إذا فشل الذكاء الاصطناعي في أي جزء من سلسلة طويلة من المهام، يمكن أن يسبب ذلك سلسلة من المشكلات لكامل الطلب. تخيل إذا حجز لك رحلة خاطئة أو وضع الوقت الخاطئ في تقويمك عندما يتعين عليك اصطحاب والدتك من المطار.
في أواخر العام الماضي، تكهنت بشأن صعود الذكاء الاصطناعي على الكمبيوتر الشخصي. كان ذلك قبل أن تجلب مايكروسوفت مفتاح Copilot إلى هذا العالم بعنف. تساءلت عما سيكون عليه الحال إذا كان بإمكان الذكاء الاصطناعي السيطرة على جهازي الكمبيوتر والتحكم في الإعدادات دون الحاجة إلى البحث في إعدادات ويندوز. تخيل أن تقول لجهاز الكمبيوتر الخاص بك أن يعرض لك عناصر التحكم في إعداد سطوع الكمبيوتر المحمول الخاص بك دون الحاجة إلى البحث في ويندوز أو في أي برنامج غير ضروري تم تضمينه أولاً في جهازك. ماذا لو كان بإمكانه القيام بذلك دون اتصال بالإنترنت، باستخدام نماذج موجودة على الجهاز حتى لا تقلق بشأن الوكالات الخارجية التي تصل إلى رسائل البريد الإلكتروني أو التقويمات الخاصة بك؟
الإعدادات ليست مثيرة، لكن جعلها أسهل للمستخدمين سيكون ميزة كبيرة. وعدت آبل بأن تكون الذكاء الاصطناعي الخاص بها هو نوع من المساعد اليومي. تريد منك أن تتخيل إذا كان لدى كل مستخدم آيفون أو آيباد أو ماك خادم شخصي قادر على التعمق في رسائل البريد الإلكتروني الخاصة بك، واستخراج المعلومات الضرورية، وتحويل ذلك إلى حدث في التقويم.
الذكاء الاصطناعي الوكيل له تداعيات على الخصوصية، ولا نعرف كيف ستتعامل شركات التكنولوجيا الكبرى مع ذلك
تمنح التطبيقات الوكيل الذكاء الاصطناعي وصولاً إلى الكثير من معلوماتك الحساسة. هذا ليس من النوع الذي يمكن التعامل معه على الأجهزة؛ إنه يتطلب معالجة سحابية. تعد آبل بالحفاظ على معلوماتك آمنة من خلال بنية الحوسبة السحابية الخاصة التي تنشئ جدار حماية بين معلوماتك وخوادم الشركة.
حتى الآن، ركزت مبادرات الوكيل من مايكروسوفت على النهاية المؤسسية، تحديدًا لأولئك الذين يستخدمون تطبيقات 365 في بيئات العمل. تروج لاستوديو Copilot للشركات لإنشاء وكلاء الذكاء الاصطناعي الداخليين الخاصة بهم.
كما تنص الأسئلة الشائعة الخاصة بها، تمتلك OpenAI وصولاً مباشرًا إلى سجلات الدردشة الخاصة بك على ChatGPT، لكنها تدعي أنها محدودة على “الأفراد المخولين”. لم توضح جوجل خططها للخصوصية عندما يصبح Gemini وكيلًا، لكن الشركة تملك وصولاً إلى نشاطك، بما في ذلك محادثاتك. تدعي أنها تستخدم هذه المعلومات “لتحسين منتجات جوجل وتقنيات التعلم الآلي”.
الذكاء الاصطناعي الوكيل قادم. مع مرور الوقت، سيتسلل إلى هواتفنا وأجهزة الكمبيوتر وغيرها من الأجهزة تحت شعار “ميزات تجريبية” أو “بيتا”. ستستمر الشركات الكبرى في الترويج لقيمة TOPS لوحدات المعالجة المركزية الجديدة الخاصة بها، وستحاول جوجل ومايكروسوفت وآبل التنافس ضد بعضهم البعض بمساعديهم المدعومين بالذكاء الاصطناعي. سيكون الأمر كما هو دائمًا، في زحف لا نهاية له من الضجة.