
حاجة أدوات الذكاء الاصطناعي لإطار عام لتقييم نماذج اللغة
يشير عاصم حجازي خبير الذكاء الاصطناعي والذي عمل لعقود مع مايكروسوفت في التعريب إلى أن السباق لاختيار أفضل نموذج لغة كبير – ChatGPT، أو Gemini، أو DeepSeek، أو Claude – غالبًا ما يغفل حقيقة بسيطة: لا نملك طريقة موحدة لتقييم هذه النماذج.
ويتابع بالقول إن معظم النقاشات على الإنترنت مدفوعة باختبارات سريعة أو حملات ترويجية غير دقيقة، ولا تعد هذه تحليلات واقعية. ويعرض عاصم إطارا لمعالجة هذا الجانب الحيوي لتقييم جودة تلك النماذج بطريقة مدروسة.
وبقترح ما أسماها مصفوفة شاملة يقدمها وهي من 20 ركيزة، مُصنفة ضمن 5 فئات أساسية، تضم ما يقرب من 200 من المحاور. هذه المصفوفة ليست مخصصة فقط لتقييم نماذج اللغة الكبيرة الحالية، بل يمكن استخدامها لتقييم المنصات الذكية الرقمية المستقبلية، أو وكلاء الذكاء الاصطناعي، أو أي أنظمة ذكاء اصطناعي توليدية تركز على الإنسان.
تكمن أهمية هذا التقييم في أنه يتجاوز ما تعاني منه معظم التقييمات الحالية وأغلبها سطحية، تتجاهل طبقاتٍ أساسية مثل كل من:
• نطاق التدريب وجودة البيانات
• الاستدلال والاستراتيجية المعرفية
• التوطين والمعرفة الثقافية
• أساليب تكامل المعرفة
• توافق الأجهزة ونشر شرائح الذكاء الاصطناعي
• نظام التطبيقات ودعم وكلاء الذكاء الاصطناعي
تؤثر هذه العناصر بشكل مباشر على الأداء والثقة وسهولة الاستخدام واستمرارية النماذج على المدى الطويل.
ماذا يوجد داخل المصفوفة؟ يُنظم الإطار التقييم في خمس فئات رئيسية:
1. أساسيات التدريب يغطي مصادر البيانات، ونطاق التدريب، ونية سلوك النموذج.
2. سلوك النموذج وذكائه يُحدد أنماط الاستدلال، والتوافق، وتدفق المحادثة، والمزيد.
3. المعرفة، والسياق، والتخصص يُقيّم كيفية تخزين برامج ماجستير علوم البيانات واسترجاعها وتطبيقها عبر المجالات.
4. جاهزية النشر والنظام البيئي يُقيّم تكامل شرائح الذكاء الاصطناعي، ودعم الوكلاء، ومرونة بناء التطبيقات، وعمق التوطين.
5. سهولة الاستخدام وتطبيق السوق يُراجع قدرات ذكاء الأعمال، ومنحنيات التبني، وقابلية التكيف مع حالات الاستخدام.
تتضمن كل فئة ركائز واضحة، مثل 'الغرض من التدريب'، و'تكامل قاعدة المعرفة'، و'جاهزية وكلاء الذكاء الاصطناعي'، وتُقسّمها إلى عوامل قابلة للقياس مع عوامل فرعية للتعمق أكثر.
أما كيفية الاستخدام فهي كما يلي:
• يمكن للمستخدمين التركيز فقط على ما يهمهم – ركيزة واحدة أو حتى عامل فرعي واحد.
• يمكن للموردين والباحثين معايرة نماذجهم بشفافية.
• يمكن للحكومات أو الشركات الكبيرة وضع معايير تنظيمية أو معايير للمشتريات.
• يمكن لمطوري الذكاء الاصطناعي توجيه جهودهم في الضبط الدقيق والتدريب بشكل أفضل
ومثال على حالة استخدام واحدة، فقد تجد ما يلي:
• يتميز ChatGPT بمتابعة التعليمات والتوجيه الفوري.
• قد يتفوق DeepSeek على غيره في التفكير القائم على الكود أو التدريب الفعال من حيث التكلفة.
• قد يتألق Gemini في التكامل متعدد الوسائط أو تغطية اللغات.
وبدلاً من السؤال 'أي نموذج أفضل'، يمكنك الآن السؤال: 'أفضل لأي ركيزة، ووفقًا لأي معيار ولأي نوع من الاستخدام؟'
النتيجة هذا هو الإصدار 1.0 من الإطار، وقد أطلقناه بعشرين ركيزة، ولكن هناك المزيد في الطريق. على سبيل المثال:
• مصفوفات متخصصة لنموذج اللغة العربية الكبيرة
• إضافات مستقبلية للتفكير العاطفي، والتوافق متعدد الوسائط، وخطوط أساس وعي الذكاء الاصطناعي
نشر هذا الإطار ليستفيد منه كل من المطورين والمستخدمين، فهو يعزز الشفافية، والمقارنة الذكية، والفهم العميق في عالمٍ يعتمد على الذكاء الاصطناعي.
هاشتاغز

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


صحيفة الخليج
منذ 2 ساعات
- صحيفة الخليج
HONOR العلامة الرائدة تكشف عن سلسلة HONOR 400 Series بكاميرا 200 ميجابكسل مدعومة بالذكاء الاصطناعي AI Creative Editor
أطلقت HONOR، العلامة التجارية الرائدة عالمياً في مجال أنظمة الأجهزة الذكية المعززة بالذكاء الاصطناعي، رسمياً سلسلة HONOR 400 Series الجديدة كلياً في منطقة الشرق الأوسط وأفريقيا خلال حدث فاخر أقيم في دبي. الحدث، الذي كان تحت شعار "HONOR AI Wonderverse"، جمع بين الجماليات العربية والتصميم المستقبلي، مما يرمز إلى دمج المثالي بين التراث والابتكار. استمتع الضيوف بتجربة فريدة من نوعها في مناطق تفاعلية مختلفة، حيث تمكنوا من استكشاف ميزات AI Creative Editor بطريقة ممتعة وجذابة. كان الحدث مبتكراً وجذاباً، حيث شمل مناطق تجربة مختلفة سمحت للضيوف باستكشاف ميزات محرر الصور الإبداعي بالذكاء الاصطناعي (AI Creative Editor) بطريقة مرحة ومبدعة. بفضل كاميرتها القوية المدعومة بالذكاء الاصطناعي، والمحرر الإبداعي (AI Creative Editor) الذكي، والأداء القوي، والمتانة المعززة، والتصميم المميز، تستعد سلسلة هواتف HONOR 400 Series لإعادة تعريف تجربة المستخدمين مع الهواتف الذكية. بتصميم أنيق مستوحى من الطبيعة، يتوفر هاتف HONOR 400 للطلب المسبق بالألوان التالية: الأسود، الفضي، و الذهبي بسعر يبدأ من 1399 درهم. عند الطلب المسبق، سيحصل المستخدمون على هدايا مجانية بقيمة 897 درهم، بما في ذلك سماعات Earbuds S7، وغطاء هاتف بطابع متحف اللوفر أبوظبي، وخدمة HONOR Care لحماية التلف العرضي لمدة 12 شهر، وضمان HONOR Care في دول مجلس التعاون. يتوفر هاتف HONOR 400 Pro للطلب المسبق بثلاثة ألوان: الأسود، الرمادي، و الأزرق بسعر 2499 درهم. عند الطلب المسبق ، سيحصل المستخدمون على هدايا مجانية بقيمة 1396 درهم بما في ذلك سماعات الأذن، وساعة HONOR CHOICE، وغطاء هاتف HONOR Art، وحماية HONOR Care ضد التلف العرضي لمدة 12 شهر، وضمان HONOR Care في دول مجلس التعاون. تصوير مبتكر بالذكاء الاصطناعي مع كاميرا 200 ميجابكسل المدعومة بالذكاء الاصطناعي. تضع سلسلة هواتف HONOR 400 Series معياراً جديداً لتصوير الهواتف الذكية من خلال نظام الكاميرا فائق الدقة بدقة 200 ميجابكسل المدعوم بالذكاء الاصطناعي، والمزود بمحرك الصور الذكي AI HONOR Image Engine)) من HONOR. وتتيح ميزة التقريب الفائق بالذكاء الاصطناعي (AI Super Zoom) تقريبًا يصل إلى 50 مرة في هاتف HONOR 400 Pro و30 مرة في هاتف HONOR 400، مما يسمح بالتقاط مشاهد بعيدة – مثل طائر في الجو أو أفق مدينة – بتفاصيل مذهلة. كما تحافظ ميزة (AI Portrait Snap) على تركيز واضح على الأهداف المتحركة مع تمويه طبيعي لخلفية الصورة. مجموعة (AI Editing) الرائدة لتعديل الصور مع (AI Creative Editor). يمنح المحرر الإبداعي المدعوم بالذكاء الاصطناعي (AI Creative Editor) المستخدمين القدرة على الارتقاء بتجربة تعديل الصور على الهاتف من خلال مجموعة من الأدوات المبتكرة. تتيح ميزة تحويل الصور إلى فيديو بالذكاء الاصطناعي (AI Image to Video) تحويل الصور الثابتة إلى مقاطع فيديو ديناميكية مدتها 5 ثوانٍ خلال دقيقة واحدة فقط. وتُقدم هذه الميزة الصور الحيّة بصيغ MP4 أو Moving Photo بأبعاد 16:9 أو 9:16، مما يفتح آفاقاً غير محدودة للإبداع. ولحل مشكلة الخلفيات المزدحمة، تعمل ميزة مسح المارة بالذكاء الاصطناعي (AI Erase Passers-by) على إزالة الأشخاص غير المرغوب فيهم من المشاهد المزدحمة بنقرة واحدة فقط، دون الحاجة إلى تحديد كل عنصر يدوياً. وتقوم هذه الميزة بدمج الخلفية بسلاسة لإبراز الهدف الرئيسي في الصورة. في الوقت نفسه، تعمل ميزة تحسين الصور بالذكاء الاصطناعي (AI Upscale) على تعزيز جودة الصور منخفضة الدقة أو القديمة من خلال تحسين التفاصيل، مما يعيد إحياء الذكريات الثمينة. كما تتضمن مجموعة من أدوات التحرير المبتكرة والإبداعية المدعومة بالذكاء الاصطناعي، مثل فتح العيون بالذكاء الاصطناعي (AI Eyes Open)، إزالة الانعكاسات (AI Remove Reflection)، القص الذكي (AI Cutout)، ملصقات الصور المتحركة (Moving Photo Collage)، وإكمال الصور بالذكاء الاصطناعي (AI Outpainting)، مما يمكّن المستخدمين من تعديل صورهم بطريقتهم الخاصة، وإطلاق العنان لإبداعهم بدون حدود. تجربة ذكية وشخصية مع MagicOS 9.0 المدعوم بالذكاء الاصطناعي تقدم سلسلة هواتف HONOR 400 Series واجهة مستخدم أكثر ذكاءً وسلاسة مع نظام MagicOS 9.0 ، المبني علىAndroid 15 . تتضمن السلسلة ميزات مدعومة بالذكاء الاصطناعي مثل الترجمة التلقائية (AI Subtitles)، التي توفر تحويل الكلام إلى نص بشكل فوري للفيديوهات أو التسجيلات. بالإضافة إلى ذلك، يسهل HONOR Connect مزامنة البيانات ونقلها بين الأجهزة، حتى عبر أنظمة تشغيل مختلفة، مثل من iOS إلى Android والعكس. وفي الوقت نفسه، تكسر ميزة الترجمة بالذكاء الاصطناعي (AI Translation) حواجز اللغة من خلال وضعي الترجمة الفورية (Real-Time) والترجمة وجهاً لوجه (Face-to-Face)، مما يجعل المحادثات متعددة اللغات أكثر سهولة. علاوة على ذلك، يقدم MagicOS 9.0 مجموعة واسعة من الابتكارات الذكية بمستوى الهواتف الرائدة، بما في ذلك AI Magic Portal 2.0، وكشف التزييف بالذكاء الاصطناعي (AI Deepfake Detection)، والعديد من المزايا الأخرى. يتيح هذا النظام الذكي للمستخدمين تبسيط مهام حياتهم اليومية سواء في العمل أو في أوقات الفراغ بسلاسة وسهولة. في طليعة تطوير وتنفيذ نظام Android استنادًا إلى شراكتها طويلة الأمد مع Google، تُعد HONOR من أوائل الشركات التي توفر أحدث تجربة لنظام Android لمستخدميها. وتُتيح هذه الشراكة لـ HONOR تمكين المطورين من الوصول السريع إلى أحدث إصدارات Android ، مما يسمح للمستخدمين بالاستفادة من أحدث الميزات وأكثرها أمانًا دون أي تأخير. علامة HONOR تعلن عن التزامها بتقديم تحديثات أندرويد لمدة 6 سنوات لسلسلة HONOR 400 Series القادمة الأجهزة الجديدة ستتضمن المزيد من قدرات الذكاء الاصطناعي من Google مع تحديثات أمان ممتدة حتى عام 2030. أداء استثنائي ومتانه رائعة بجانب الميزات المدعومة بالذكاء الاصطناعي، قامت HONOR بتزويد الأجهزة بمكونات متميزة لتوفير تجربة سلسة وسريعة للغاية. تعمل سلسلة HONOR 400 ببطارية بسعة 6000mAh، بينما تم تحسين النسخة Pro بتقنية الشحن السريع 100W HONOR SuperCharge. من حيث المتانة، تتمتع السلسلة بشهادة مقاومة للماء والغبار، بينما تم تحسين النسخة Pro مع تصنيفات IP68 و IP69، مما يوفر حماية إضافية. سواء كنت شغوفاً بالتقاط الصور، أو تحب إنشاء القصص الإبداعية، أو تحتاج إلى جهاز يعزز الإنتاجية أثناء التنقل، فإن سلسلة HONOR 400 تقدم أداء استثنائياً وابتكاراً يناسب جميع المستخدمين.


صحيفة الخليج
منذ 2 ساعات
- صحيفة الخليج
«أبل» تخطط لإطلاق نظارات ذكية في 2026
قالت وكالة بلومبرج نيوز، الخميس إن أبل تخطط لإطلاق نظارات ذكية في نهاية العام المقبل، في أحدث مسعى لمصنعة هواتف آيفون لتنويع منتجاتها وتعزيز الطلب على أجهزتها التي تعمل بالذكاء الاصطناعي. ونقل التقرير عن مصادر مطلعة أن أبل ستبدأ في إنتاج كميات كبيرة من النماذج الأولية للأجهزة في نهاية هذا العام مع موردين من الخارج. وتتوجه الشركة نحو النظارات بعد أن شهدت وحدات فيجن برو إقبالاً فاتراً من المستهلكين بسبب سعرها الباهظ وافتقارها إلى ميزات الذكاء الاصطناعي. وستنافس نظارة أبل الجديدة نظارة راي بان الذكية الخاصة بشركة ميتا، التي أصبحت تحظى بشعبية لدى المستهلكين. وذكر التقرير أن أبل علقت خططاً لإنتاج ساعة ذكية قادرة على تحليل محيطها عن طريق كاميرا مدمجة. وأضاف التقرير أن الشركة كانت تعمل على إصدار ساعة مزودة بكاميرا بحلول عام 2027، لكن تم إيقاف هذا المشروع. (رويترز)


صحيفة الخليج
منذ 2 ساعات
- صحيفة الخليج
«كلود 4».. أقوى نماذج للذكاء الاصطناعي من «أنثروبيك»
أطلقت «أنثروبيك» Anthropic عائلتها الجديدة من نماذج الذكاء الاصطناعي التوليدية «كلود 4» (Claude 4)، تقول شركة الذكاء الاصطناعي الناشئة إنها مصممة لإظهار قدرتها على المنافسة مع أدوات المساعدة الرائدة في الذكاء الاصطناعي بطريقة أكثر مسؤولية من منافسيها. قال الرئيس التنفيذي والمؤسس المشارك لـ«أنثروبيك» داريو أمودي في افتتاح مؤتمر المطورين الأول للشركة الخميس: «تُعد النسخة الرابعة من +كلود+ Opus 4 أفضل نموذج برمجة في العالم». ويُعدّ كل من «Opus 4»، النموذج الأقوى لدى الشركة الناشئة، و«Sonnet 4»، نموذجين هجينين، إذ يمكنهما تقديم إجابات فورية أو تنفيذ مهام أطول في الخلفية، مثل برمجة الكمبيوتر أو تحليل البيانات الفنية لإنتاج تقرير مفهوم. وطُبع عام 2023 بالسباق لإطلاق واجهات منافسة لـ«تشات جي بي تي» ChatGPT. ومذاك، أصبحت أدوات المساعدة العاملة بالذكاء الاصطناعي أكثر قدرة على «التفكير»، إذ باتت تستغرق وقتاً أطول للاستجابة وعرض مراحل تفكيرها، كما ازدادت استقلالية. وتركز شركات التكنولوجيا الأمريكية حالياً على «وكلاء الذكاء الاصطناعي»، وهي أدوات تؤدي مهام مختلفة نيابة عن المستخدم. وكانت «أنثروبيك» رائدة في هذا المجال مع إصدار نظام «Computer use» («استخدام الكمبيوتر») في خريف عام 2024، والذي يسمح لـ«كلود» باستخدام أجهزة الكمبيوتر مثل الإنسان: فهو يتصفح الإنترنت، ويختار الأزرار على موقع ما، ويُدخل النص ويستخدم برامج مختلفة. وقال مايك كريغر، كبير مسؤولي المنتجات في «أنثروبيك» والمؤسس المشارك لإنستغرام «يمكن للوكلاء تحويل الخيال البشري إلى واقع ملموس على نطاق غير مسبوق، وهذا مهم بشكل خاص للمطورين مثلكم». واستذكر الأيام الأولى لتطبيق إنستغرام قبل أن تستحوذ عليه فيسبوك، عندما كان فريقها الصغير مضطراً للاختيار بين تطوير ميزة جديدة أو تحسين التطبيق المحمول، على سبيل المثال. وأضاف كريغر «بفضل وكلاء الذكاء الاصطناعي، يمكن للشركات الناشئة الآن إجراء تجارب متوازية، والتحسين من خلال تعليقات المستخدمين، وبناء المنتجات بشكل أسرع من أي وقت مضى».