TeleAI تعلن عن مقياس جديد لقياس “الموهبة” في نماذج اللغة الكبيرة

(SeaPRwire) – بكين، 19 ديسمبر 2025 — في تقدم كبير لتقييم نماذج الذكاء الاصطناعي، قدم معهد الذكاء الاصطناعي التابع لـ China Telecom مقياسًا رائدًا — سعة المعلومات — يعيد تعريف كيفية تقييم النماذج اللغوية الكبيرة (LLMs) بعيدًا عن المقارنات التقليدية القائمة على الحجم. يكشف هذا النهج الجديد أن “الموهبة” الحقيقية للنموذج لا تكمن في حجمه، بل في كفاءته في ضغط ومعالجة المعرفة نسبة إلى تكلفته الحسابية.

سعة المعلومات هي نسبة ذكاء النموذج إلى تعقيد الاستدلال، مما يمثل كثافة المعرفة الكامنة في النموذج. على سبيل التشبيه: إذا كان النموذج إسفنجة والمعلومات هي الماء، فإن سعة المعلومات تعكس كفاءة امتصاص الإسفنجة للماء — كلما امتصت كمية أكبر من الماء وبسرعة أكبر، كلما أثبت النموذج أنه “أذكى”. أظهرت النتائج التجريبية المذكورة أن النماذج ذات الأحجام المختلفة ضمن سلسلة واحدة تُظهر سعة معلومات متسقة. لذلك، يتيح مقياس سعة المعلومات إجراء مقارنة عادلة للكفاءة عبر سلاسل النماذج والتنبؤ الدقيق بالأداء داخل سلسلة نماذج واحدة.

تحت إشراف البروفيسور Xuelong Li، الرئيس التنفيذي للتكنولوجيا والعالم الرئيسي في China Telecom، ومدير معهد الذكاء الاصطناعي التابع لـ China Telecom، استفاد فريق البحث من سعة المعلومات كمقياس لتقييم “الموهبة” في النماذج اللغوية الكبيرة. بدافع من الارتباط القوي بين الضغط والذكاء، تقيس سعة المعلومات كميًا كفاءة النموذج اللغوي الكبير بناءً على أداء الضغط نسبة إلى تعقيده الحسابي. لا تكشف فقط عن كثافة الذكاء التي ينتجها النموذج لكل وحدة تكلفة حسابية، بل تسهل أيضًا التخصيص الأمثل للموارد الحاسوبية وموارد الاتصالات ضمن إطار عمل AI Flow.

مع استهلاك أعباء عمل الاستدلال للنماذج الكبيرة لكميات متصاعدة من الموارد الحسابية والطاقة، اجتذب التقييم الدقيق لكفاءة الاستدلال اهتمامًا متزايدًا من باحثي النماذج اللغوية الكبيرة. عبر مقياس سعة المعلومات، أصبح من الممكن تقييم كفاءة النماذج الكبيرة عبر هياكل وأحجام مختلفة. علاوة على ذلك، يمكن لهذا المقياس أيضًا توجيه التدريب المسبق للنموذج ونشره بشكل فعال.

لا يوفر هذا البحث معيارًا كميًا فحسب لتطوير أكثر اخضرارًا للنماذج الكبيرة، بل يسهل أيضًا التوجيه الديناميكي للنماذج ذات الأحجام المختلفة للمعالجة الفعالة للمهام ذات الصعوبات المتفاوتة، وهو أمر ذو صلة خاصة بالبنية التحتية “الجهاز-الحافة-السحابة” الخاصة بإطار عمل AI Flow. مع التطور السريع للذكاء على الحافة، فإن الشبكة الهرمية “الجهاز-الحافة-السحابة” الخاصة بـ AI Flow تتجه لتحل محل النموذج الحسابي السائد المرتكز على السحابة في المستقبل القريب.

حتى الآن، تم نشر جميع الأكواد والبيانات ذات الصلة من هذا البحث بشكل مفتوح المصدر على GitHub و Hugging Face، مما يمكن المجتمع من دفع عجلة توحيد معايير تقييم كفاءة النماذج الكبيرة بشكل جماعي.

مستودع الأكواد:
مجموعة البيانات:
لوحة المتصدرين:

يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.

القطاعات: العنوان الرئيسي، الأخبار اليومية

يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.

للاتصال: Ziyao Tang
tangzy14@chinatelecom.cn