
خبراء يحذرون: لا تثق بكل ما يُقال عن تفوق نماذج الذكاء الاصطناعي
مع تزايد الاعتماد على الذكاء الاصطناعي في العمل والحياة اليومية، أصبح اختيار النموذج الأنسب تحديًا حقيقيًّا. حيث تضخ الشركات الكبرى نماذج جديدة بوتيرة متسارعة، وكل منها يَعِدُ بأنه "الأكثر تفوقًا". لكن خلف هذه الوعود، هناك أسئلة حقيقية تُطرح حول مدى مصداقية هذا التفوق.
السباق على التفوق يضعف نزاهة التقييم
غاري ماركوس، عالم الأعصاب والباحث في الذكاء الاصطناعي، قال: "عندما يصبح الأداء على اختبارات معينة عاملًا حاسمًا لصرف مليارات الدولارات، تبدأ الشركات بتعليم النماذج كيف تتجاوز هذه الاختبارات تحديدًا، وهو ما يُضعف من مصداقية النتائج بمرور الوقت".
وفي دراسة أوروبية حديثة بعنوان "هل يمكن الوثوق باختبارات الذكاء الاصطناعي؟"، أكد الباحثون أن معايير الأداء الحالية تعاني "عيوبًا منهجية"، وهي متأثرة بثقافة تنافسية وتجارية تضع الأداء التقني فوق الاعتبارات الأخلاقية والمجتمعية.
الأداء الحقيقي للنماذج قد لا ينعكس على الواقع
من جانبه، قال دين فالنتاين، المؤسس المشارك والرئيس التنفيذي لشركة أمن سيبراني تعمل بالذكاء الاصطناعي، إنه وفريقه اختبروا عددًا من النماذج الجديدة منذ إطلاق Claude 3.5 Sonnet، ولم يلاحظوا أي "تحسن جوهري" على أرض الواقع.
وأضاف: "بعض النماذج صارت ممتعة أكثر في المحادثة، لكن هذا لا يعني أنها تقدم فائدة اقتصادية أو قدرة عامة حقيقية. معظم التقدم المزعوم مجرد كلام تسويقي".
هل تقيس "المعايير" ما يجب أن نقيسه فعلًا؟
خلال 2025 فقط، أُطلِق ما لا يقل عن 12 نموذجًا جديدًا من شركات مثل OpenAI، Meta، Google، وAnthropic، جميعها ادعت تفوقها في اختبارات الأداء أو ما يعرف بـ Benchmarks.
لكن هذه المعايير بدأت تواجه تشكيكًا واسعًا، إذ يقول خبراء إن نتائجها قد تكون "مضللة أو غير موثوقة".
في هذا السياق، واجهت Meta مؤخرًا انتقادات بعد إعلانها أن Llama 4 Maverick يتفوق على نماذج منافسة، ليتبين لاحقًا أنها استخدمت إصدارًا "مُخصصًا" للظهور بمستوى أعلى على منصة LMArena، وهي جهة تقييم تعتمد على تصويت الجمهور.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الشرق السعودية
منذ 12 ساعات
- الشرق السعودية
ترمب يعتزم توقيع أوامر لتعزيز إنتاج الطاقة النووية الجمعة
قالت 4 مصادر مطلعة إن الرئيس الأميركي دونالد ترمب ربما يوقع، الجمعة، على أوامر تنفيذية تهدف إلى تعزيز قطاع الطاقة النووية من خلال تسهيل الإجراءات التنظيمية التي تتعلق بالموافقات على المفاعلات الجديدة ودعم سلاسل إمدادات الوقود. وفي ظل أول ارتفاع في الطلب على الكهرباء منذ عقدين بسبب توسع أنشطة الذكاء الاصطناعي، أعلن ترمب حالة طوارئ في مجال الطاقة في أول يوم له في منصبه. ويقول وزير الطاقة، كريس رايت، إن السباق لتطوير مصادر للكهرباء ومراكز البيانات اللازمة للذكاء الاصطناعي هو "مشروع مانهاتن 2"، في إشارة إلى البرنامج الضخم الذي عملت عليه الولايات المتحدة خلال الحرب العالمية الثانية لتطوير قنابل ذرية. وجاء في مسودة ملخص للأوامر أن ترمب سيفعّل قانون الإنتاج الدفاعي الذي يعود إلى حقبة الحرب الباردة لإعلان حالة طوارئ وطنية على خلفية اعتماد الولايات المتحدة على روسيا والصين في الحصول على اليورانيوم المخصب ومعالجة الوقود النووي ومدخلات المفاعلات المتقدمة. ويوجه الملخص أيضا الوكالات إلى التصريح لمنشآت نووية جديدة وتحديد مواقع لها وتبسيط الإجراءت اللازمة لبنائها. ولم يرد البيت الأبيض على الفور على طلب للتعليق. وقد يخضع نص وصياغة مسودات الأوامر التنفيذية لتغييرات متكررة. وكانت الولايات المتحدة أول مطور للطاقة النووية ولديها أكبر قدرة نووية في العالم، إلا أن الصين تشهد حاليا أسرع نمو لهذا المصدر من الطاقة. بنية تحتية للذكاء الاصطناعي وفي يناير الماضي، أعلن ترمب عن استثمار القطاع الخاص ما يصل إلى 500 مليار دولار لتمويل البنية التحتية للذكاء الاصطناعي، ضمن مشروع Stargate. وتخطط شركة OpenAI، ومجموعة SoftBank، وشركة Oracle لمشروع مشترك مقره تكساس يسمى Stargate، وتعهدت بأن تستثمر فيه 100 مليار دولار في البداية ثم ما يصل إلى 500 مليار دولار على مدى السنوات الأربع المقبلة. وانضم رئيس SoftBank التنفيذي ماسايوشي سون، ونظيراه في OpenAI سام ألتمان، وفي Oracle لاري إليسون، إلى ترمب في البيت الأبيض لإطلاق المشروع. وستركز Stargate على بناء "البنية التحتية المادية والافتراضية لدعم الجيل المقبل من الذكاء الاصطناعي"، بما في ذلك إنشاء مراكز بيانات في جميع أنحاء الولايات المتحدة، ووصف ترمب المشروع بأنه "أكبر مشروع بنية تحتية للذكاء الاصطناعي في التاريخ". ويتطلب الذكاء الاصطناعي قوة حوسبة هائلة، مما يزيد الطلب على مراكز البيانات المتخصصة التي تمكن شركات التكنولوجيا من ربط آلاف الرقائق معاً في مجموعات.


الوئام
منذ 18 ساعات
- الوئام
آيف ينضم إلى OpenAI.. خطوة لإعادة رسم ملامح الحواسيب في عصر الذكاء الاصطناعي
في خطوة وُصفت بأنها نقطة تحول في العلاقة بين التصميم والتقنية، أعلنت شركة OpenAI انضمام المصمم البريطاني العالمي السير جوني آيف إلى صفوفها، في إطار شراكة استراتيجية تهدف إلى تطوير جيل جديد من الأجهزة الذكية المدعومة بالذكاء الاصطناعي. وتتضمن الاتفاقية استحواذ OpenAI على شركة 'io'، التي أسسها آيف العام الماضي، في صفقة تبلغ قيمتها نحو 6.5 مليار دولار، ما يمثل أحد أكبر استثمارات الشركة خارج قطاع البرمجيات. الرئيس التنفيذي لشركة OpenAI، سام ألتمان، عبّر عن سعادته بهذه الخطوة، واصفًا آيف بأنه 'أعظم مصمم في العالم'، وقال: 'لدينا فرصة نادرة لإعادة تصور شكل وطبيعة الحاسوب في العصر الرقمي القادم'. وسيتولى آيف، صاحب البصمة التصميمية لأشهر منتجات آبل مثل iPhone وiMac وiPod وiPad، مسؤوليات إبداعية واسعة داخل OpenAI، تشمل قيادة تصميم أجهزة جديدة ترتكز على قدرات الذكاء الاصطناعي التوليدي. من جانبه، قال آيف إن العالم يقف على أعتاب 'جيل جديد من التكنولوجيا'، مضيفًا أن الجهاز الأول الذي يعمل عليه مع فريقه في OpenAI 'أسر خيال الجميع'، مشيرًا إلى أن هذه الشراكة قد تسفر عن 'عائلة جديدة من الأجهزة التي ستحدث تحولًا في طريقة تفاعل البشر مع التقنية'. وتسعى OpenAI من خلال هذه الخطوة إلى تقليل اعتمادها على الأجهزة المصنعة من قبل شركات كبرى مثل آبل وغوغل، وبناء علاقة مباشرة مع المستخدمين عبر أجهزة تحمل بصمتها الخاصة. وقال ألتمان إنه جرّب نموذجًا أوليًا لأحد الأجهزة الجديدة واصفًا إياه بأنه: 'ربما يكون أروع منتج تكنولوجي شهده العالم حتى الآن'. يُعد السير جوني آيف أحد أبرز الأسماء في تاريخ التصميم الصناعي الحديث، حيث ارتبط اسمه بمرحلة النهضة الكبرى التي شهدتها شركة آبل منذ أواخر التسعينيات، وكان له دور محوري في تصميم منتجات شكلت ثورة في عالم التقنية والاستهلاك الرقمي. وغادر آيف آبل في عام 2019 بعد 27 عامًا من العمل، ليؤسس شركته الخاصة LoveFrom، والتي تعاونت بهدوء مع OpenAI على مدار العامين الماضيين، وكانت هذه الشراكة التمهيد لفكرة تأسيس شركة 'io' لاحقًا. التحالف الجديد بين OpenAI وآيف يأتي في وقت تتسابق فيه شركات التقنية الكبرى، مثل ميتا وغوغل وآبل، على تطوير أجهزة ذكية مدعومة بالذكاء الاصطناعي، بينها نظارات وسماعات تعتمد على واجهات طبيعية وتفاعلية. لكن تجارب سابقة مثل جهاز 'AI Pin' من شركة Humane، التي أسسها موظفون سابقون في آبل، لم تحقق النجاح المأمول، وسط شكاوى من مشاكل تقنية وارتفاع في الأسعار. ويرى محللون أن دخول اسم بحجم جوني آيف على خط تطوير الأجهزة في OpenAI قد يشكل فارقًا كبيرًا في السباق العالمي نحو الحاسوب الجديد، خاصة مع تزايد الطلب على تقنيات توفر تجربة شخصية وفورية تتجاوز حدود الشاشة التقليدية. ويختم كبير المحللين في CCS Insight، بن وود، بقوله: 'الرهان على جوني آيف ليس مغامرة… تاريخه الحافل يثبت أنه قادر على قلب الموازين مجددًا'.


الرجل
منذ يوم واحد
- الرجل
سيرجي برين: الإدارة من أسهل المهام التي يمكن للذكاء الاصطناعي إنجازها
في حلقة جديدة من بودكاست "All In"، كشف سيرجي برين، الشريك المؤسس لشركة جوجل، عن اعتماده المتزايد على الذكاء الاصطناعي لأداء مهام إدارية داخل الشركة، منذ عودته عام 2023 للمساهمة في تطوير منتجات الذكاء الاصطناعي وسط تنافس شرس مع شركات ناشئة مثل OpenAI و Anthropic. توزيع المهام وترشيح للترقية.. بإشراف الذكاء الاصطناعي قال برين خلال المقابلة: "الإدارة من أسهل الأمور التي يمكن تنفيذها بالذكاء الاصطناعي"، موضحًا أنه استخدم أحد النماذج الكبيرة لتلخيص محادثات الفرق داخل غرف الدردشة، ثم طلب منه توزيع المهام على الأعضاء بناءً على مضمون النقاش. وأضاف برين أن الأداة أثبتت فاعليتها لدرجة أنه طلب منها لاحقًا تحديد الموظف الأنسب للترقية، لتفاجئه بترشيح مهندسة شابة لم تكن لافتة للنظر في النقاشات. وبعد استفساره من المدير المباشر، تبيّن أن تقييم الأداة كان دقيقًا، وأن المهندسة كانت بالفعل تؤدي عملًا مميزًا، ما ساهم في ترشيحها للترقية. الذكاء الاصطناعي يتفوق في المهام التحليلية أكد برين أن قدرات الذكاء الاصطناعي تتفوق على البشر في بعض المهام الدقيقة مثل البرمجة والرياضيات، لافتًا إلى أنه بات يستخدم هذه الأدوات في أدوار قيادية على نحو يومي. اتجاه متصاعد بين كبار التنفيذيين انضم برين إلى قائمة من قادة التقنية الذين باتوا يعتمدون على الذكاء الاصطناعي في عملهم اليومي، مثل الرئيس التنفيذي لشركة Nvidia، جنسن هوانغ، الذي يستخدم أدوات مثل ChatGPT وGemini كـ "مدرّس شخصي"، فيما يعتمد كبير تقنيي Duolingo على مبدأ تحويل المهام القابلة للأتمتة إلى تعليمات تُنجز باستخدام الذكاء الاصطناعي. مع ذلك، لا يزال بعض التنفيذيين مترددين. فقد صرّح دان شابيرو، مدير العمليات في LinkedIn، أنه يفضّل الاحتفاظ بالجانب الإنساني من الإدارة، موضحًا أن الإلهام والتواصل العميق ما تزال مهارات بشرية لا يمكن للذكاء الاصطناعي محاكاتها بالكامل.