ويكيبيديا تُنشئ مجموعة بيانات لتدريب الذكاء الاصطناعي بسبب الضغط الناتج عن الروبوتات

أعلنت مؤسسة ويكيميديا يوم الأربعاء عن شراكتها مع كاجل، المنصة الشهيرة في مجتمع علوم البيانات المملوكة لشركة جوجل، لإصدار نسخة من ويكيبيديا مُحسّنة لتدريب نماذج الذكاء الاصطناعي. بدءًا من اللغتين الإنجليزية والفرنسية، ستقدم المؤسسة نسخًا مُبسطة من النصوص الخام لويكيبيديا، مستبعدة أي مراجع أو رموز تنسيق.

كونها منصة غير ربحية يقودها المتطوعون، تعتمد ويكيبيديا بشكل كبير على التبرعات ولا تمتلك المحتوى الذي تستضيفه، مما يسمح لأي شخص باستخدام وإعادة مزج المحتوى من المنصة. وهي ترحب باستخدام المنظمات الأخرى لمجموعة معارفها الواسعة في جميع أنواع الحالات—على سبيل المثال، كاجل هو نسخة غير متصلة بالإنترنت من ويكيبيديا تم استخدامها لتهريب المعلومات إلى كوريا الشمالية.

لكن تدفق الروبوتات الذي يقوم باستمرار بتفتيش موقعها لتلبية احتياجات تدريب الذكاء الاصطناعي أدى إلى زيادة غير مسبوقة في حركة المرور غير البشرية على ويكيبيديا، وهو شيء كانت المؤسسة مهتمة بحله مع ارتفاع التكاليف. في وقت سابق من هذا الشهر، قالت المؤسسة إن استهلاك النطاق الترددي قد زاد بنسبة 50% منذ يناير 2024. يجب أن يساعد تقديم نسخة قياسية من مقالات ويكيبيديا بتنسيق JSON في تثبيط مطوري الذكاء الاصطناعي عن قصف الموقع.

قالت بريندا فلين، رئيسة شراكات كاجل: “بصفتها المكان الذي يأتي إليه مجتمع التعلم الآلي للحصول على الأدوات والاختبارات، فإن كاجل متحمسة للغاية لأن تكون المضيف لبيانات مؤسسة ويكيميديا”، في تصريح لـذا فيرج. “كاجل متحمسة للعب دور في الحفاظ على هذه البيانات متاحة وملائمة ومفيدة.”

ليس سراً أن شركات التكنولوجيا لا تحترم في الأساس منشئي المحتوى وتضع قيمة قليلة على أي عمل إبداعي فردي. هناك مدرسة فكرية متزايدة في الصناعة تقول إن جميع المحتويات يجب أن تكون مجانية وأن أخذها من أي مكان على الويب لتدريب نموذج ذكاء اصطناعي يعتبر استخدامًا عادلًا نظرًا للطبيعة التحويلية لنماذج اللغة.

لكن شخصًا ما يجب أن ينشئ المحتوى في المقام الأول، وهو ليس رخيصًا، وقد كانت الشركات الناشئة في مجال الذكاء الاصطناعي مستعدة تمامًا لتجاهل المعايير المقبولة سابقًا حول احترام رغبات الموقع بعدم الزحف إليه. تحتاج نماذج اللغة التي تنتج نصوصًا شبيهة بالبشر إلى أن تُدرب على كميات ضخمة من المواد، وقد أصبحت بيانات التدريب شيئًا يشبه النفط في طفرة الذكاء الاصطناعي. من المعروف أن النماذج الرائدة تُدرب باستخدام أعمال محمية بحقوق الطبع والنشر، ولا تزال العديد من شركات الذكاء الاصطناعي في نزاعات قانونية حول هذه القضية. التهديد للشركات من تشيج إلى ستاك أوفر فلو هو أن شركات الذكاء الاصطناعي ستقوم بامتصاص محتواها وإعادته للمستخدمين دون توجيه حركة المرور إلى الشركات التي أنشأت المحتوى في المقام الأول.

قد لا يحب بعض المساهمين في ويكيبيديا أن يتم إتاحة محتواهم لتدريب الذكاء الاصطناعي، لأسباب عديدة وغيرها. جميع الكتابات على الموقع مرخصة بموجب رخصة المشاع الإبداعي Attribution-ShareAlike، التي تسمح لأي شخص بـمشاركة العمل وتعديله والبناء عليه بحرية، حتى تجاريًا، طالما أنهم ينسبون الفضل إلى المنشئ الأصلي ويرخصون أعمالهم المشتقة بنفس الشروط.

أخبرت مؤسسة ويكيميديا موقع جيزمو أن كاجل تدفع مقابل البيانات من خلال ويكيميديا إنتربرايز، وهو عرض متميز يسمح للمستخدمين ذوي الحجم الكبير بإعادة استخدام المحتوى بسهولة أكبر. وقالت إن مستخدمي المحتوى، مثل شركات نماذج الذكاء الاصطناعي، لا يزال من المتوقع أن يحترموا شروط النسبة والترخيص الخاصة بويكيبيديا.

المصدر

  • سفيان

    ذات صلة

    جزء ثانٍ متفجر وقوي بالعواطف

    لم تنتهِ الحديث عن Lost Records : Bloom & Rage بعد. بعد صدور الحلقة الأولى في فبراير 2025، يعود لعبة Don’t Nod بجزء ثانٍ أكثر ظلمة وجدية وحيوية. ملخص بعد…

    Honor Magic V5 قد يحتوي على بطارية أكبر من Z Fold 7

    يُشاع أن هاتف Honor Magic V5، الذي لم يُعلن عنه بعد، سيأتي ببطارية أكبر من تلك الموجودة في هاتف Samsung Galaxy Z Fold 7. وفقًا لتقرير من GSMArena، من المتوقع…

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    فاتك

    جزء ثانٍ متفجر وقوي بالعواطف

    • مايو 15, 2025
    جزء ثانٍ متفجر وقوي بالعواطف

    Honor Magic V5 قد يحتوي على بطارية أكبر من Z Fold 7

    • مايو 15, 2025
    Honor Magic V5 قد يحتوي على بطارية أكبر من Z Fold 7

    البرميل المتفجر تحت قصة الخادمة ينفجر أخيرًا

    • مايو 15, 2025
    البرميل المتفجر تحت قصة الخادمة ينفجر أخيرًا

    جروك AI يرد على تغريدات عشوائية بمعلومات حول “الإبادة البيضاء”

    • مايو 15, 2025
    جروك AI يرد على تغريدات عشوائية بمعلومات حول “الإبادة البيضاء”

    كيفية مشاهدة حدث إطلاق سامسونج جالاكسي S25 إيدج

    • مايو 14, 2025
    كيفية مشاهدة حدث إطلاق سامسونج جالاكسي S25 إيدج

    عالم جديد شجاع في دور السينما، وسيكون متاحًا للبث قريبًا

    • مايو 14, 2025
    عالم جديد شجاع في دور السينما، وسيكون متاحًا للبث قريبًا