logo
أخبار التكنولوجيا : هل بالغت OpenAI في أداء o3؟ نتائج FrontierMath تكشف عن 10% فقط

أخبار التكنولوجيا : هل بالغت OpenAI في أداء o3؟ نتائج FrontierMath تكشف عن 10% فقط

الثلاثاء 22 أبريل 2025 06:00 صباحاً
نافذة على العالم - أظهر نموذج الذكاء الاصطناعي o3 من OpenAI، الذي صدر الأسبوع الماضي، أداءً ضعيفًا في معيار محدد، حيث أشارت شركة Epoch AI، الشركة المسئولة عن معيار FrontierMath، إلى أن النسخة المتاحة للجمهور من نموذج الذكاء الاصطناعي o3 حققت 10% في الاختبار، وهي نسبة أقل بكثير من ادعاء الشركة عند الإطلاق.
وكان مارك تشين، كبير مسؤولي الأبحاث في شركة الذكاء الاصطناعي ومقرها سان فرانسيسكو، قد صرّح بأن النموذج حقق 25% في الاختبار، محققًا رقمًا قياسيًا جديدًا، ومع ذلك، فإن هذا التباين لا يعني أن OpenAI كذبت بشأن هذا المقياس.
وفي ديسمبر 2024، أجرت OpenAI بثًا مباشرًا على يوتيوب ومنصات التواصل الاجتماعي الأخرى، للإعلان عن نموذج الذكاء الاصطناعي o3، وفي ذلك الوقت، سلّطت الشركة الضوء على مجموعة القدرات المُحسّنة في نموذج اللغة الكبير (LLM)، وتحديدًا، أدائه المُحسّن في الاستعلامات القائمة على الاستدلال.
ومن الطرق التي جسّدت بها الشركة هذا الادعاء مشاركة نتائج النموذج المرجعية عبر اختبارات شائعة مُختلفة، ومن بين هذه الاختبارات اختبار FrontierMath، الذي طورته شركة Epoch AI. يُعرف هذا الاختبار الرياضي بصعوبته وقدرته على التلاعب، حيث طوّره أكثر من 70 عالم رياضيات، وجميع المسائل فيه جديدة وغير منشورة، والجدير بالذكر أنه حتى ديسمبر، لم يُجْزِ أي نموذج ذكاء اصطناعي أكثر من 9% من الأسئلة في محاولة واحدة.
ومع ذلك، عند إطلاقه، ادّعى تشين أن o3 تمكّنت من تحقيق رقم قياسي جديد بتسجيلها 25% في الاختبار، ولم يكن التحقق الخارجي من الأداء ممكنًا في ذلك الوقت، نظرًا لعدم توفر النموذج في المجال العام، وبعد إطلاق o3 وo4-mini الأسبوع الماضي، نشرت شركة Epoch AI منشورًا على منصة X (المعروفة سابقًا باسم تويتر)، مدّعيةً أن نموذج o3، في الواقع، قد حقق 10% في الاختبار.
ومع أن نسبة 10% تجعل نموذج الذكاء الاصطناعي الأعلى تصنيفًا في الاختبار، إلا أن هذا الرقم أقل من نصف ما ادّعته الشركة، وقد دفع هذا المنشور العديد من المتحمسين للذكاء الاصطناعي إلى الحديث عن صحة نتائج اختبارات الأداء المعيارية.
ولا يعني هذا التباين أن OpenAI كذبت بشأن أداء نموذج الذكاء الاصطناعي الخاص بها، بل على العكس، من المرجح أن نموذج شركة الذكاء الاصطناعي غير المُصدر استخدم قدرات حوسبة أعلى للحصول على هذه النتيجة، ومع ذلك، يُرجّح أن النسخة التجارية من النموذج قد عُدّلت لتكون أكثر كفاءة في استهلاك الطاقة، وفي هذه العملية، تم تخفيف بعض أدائها.
على صعيد منفصل، نشرت ARC Prize، وهي المنظمة التي تقف وراء اختبار ARC-AGI المعياري، الذي يختبر الذكاء العام لنموذج الذكاء الاصطناعي، أيضًا على منصة X حول هذا التباين، وأكد المنشور أن "نموذج o3 الصادر يختلف عن النموذج الذي اختبرناه في ديسمبر 2024".
وزعمت الشركة أن مستويات الحوسبة في نموذج o3 الصادر أصغر من الإصدار الذي اختبرته. ومع ذلك، أكدت أن o3 لم يُدرّب على بيانات ARC-AGI، حتى في مرحلة ما قبل التدريب.
وأعلنت جائزة ARC أنها ستعيد اختبار نموذج الذكاء الاصطناعي o3 الصادر وستنشر النتائج المحدثة. كما ستعيد الشركة اختبار نموذج o4-mini، وستصنف النتائج السابقة على أنها "معاينة"، وليس من المؤكد أن أداء الإصدار الصادر من o3 سيكون دون المستوى في هذا الاختبار أيضًا.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

تقرير.. الكشف عن ملامح أول جهاز ل OpenAI
تقرير.. الكشف عن ملامح أول جهاز ل OpenAI

أخبار مصر

timeمنذ ساعة واحدة

  • أخبار مصر

تقرير.. الكشف عن ملامح أول جهاز ل OpenAI

كشفت صحيفة وول ستريت جورنال أن أول جهاز تعمل عليه OpenAI بالتعاون مع مصمم آبل السابق جوني آيف لن يكون هاتفًا ذكيًا ولا جهازًا قابلًا للارتداء، بل قد لا يحتوي حتى على شاشة، مما يشير إلى توجه مبتكر وغير تقليدي في فئة الأجهزة الذكية.ويأتي ذلك بعد إعلان شركة OpenAI استحواذها على شركة io الناشئة التي أسسها آيف، في صفقة تُقدّر قيمتها بـ 6.5 مليارات دولار. ووفقًا للتقرير، فقد أبلغ الرئيس التنفيذي سام ألتمان موظفي الشركة بأن لديهم الآن فرصة لإنجاز أعظم مشروع في تاريخ OpenAI . وأشار كل من آيف وألتمان إلى بعض ملامح الجهاز الجديد، إذ أوضحا أنه سيكون واعيًا تمامًا بمحيطه وبنشاطات المستخدم، كما سيتميز بتصميم غير مزعج يمكن وضعه في الجيب أو على المكتب، ومن المتوقع أن يتحوّل إلى أحد الأجهزة الأساسية للمستخدمين بعد الحاسوب والهاتف.وبحسب التقرير، فإن الجهاز لن يكون هاتفًا أو نظارة ذكية، وهو ما يعكس رغبة الفريق في تقليل الاعتماد على الشاشات، إذ يطمح آيف وألتمان إلى…..لقراءة المقال بالكامل، يرجى الضغط على زر 'إقرأ على الموقع الرسمي' أدناه

OpenAI تستحوذ على شركة io لتصميم الأجهزة الذكية
OpenAI تستحوذ على شركة io لتصميم الأجهزة الذكية

أخبار مصر

timeمنذ ساعة واحدة

  • أخبار مصر

OpenAI تستحوذ على شركة io لتصميم الأجهزة الذكية

أعلنت شركة OpenAI استحواذها على شركة io الناشئة والمتخصصة في تطوير العتاد الذكي، وهي الشركة التي أسّسها مصمم آبل الشهير جوني آيف إلى جانب عدد من المهندسين البارزين الذين عملوا سابقًا معه في آبل، منهم سكوت كانون، وإيفانز هانكي، وتانغ تان.ووفقًا لتقرير نشرته وكالة بلومبرج، فإن قيمة الصفقة تُقدّر بنحو 6.5 مليارات دولار، وتشمل انتقال نحو 55 من مهندسي العتاد والمطورين والخبراء في التصنيع إلى صفوف OpenAI، ومنهم الأسماء الثلاثة البارزة المشاركة في التأسيس. ومع أن جوني آيف لن ينضم رسميًا إلى OpenAI، فإن شركته التصميمية LoveFrom ستتولى مهام التصميم لكافة منتجات OpenAI المستقبلية والبرمجيات الخاصة بها، مع الحفاظ على استقلاليتها.ومن المتوقع إطلاق أولى الأجهزة الناتجة عن هذا التعاون الجديد في عام 2026. وقد أشار آيف في مقابلة مع وكالة بلومبرغ إلى أن معظم الأجهزة المدعومة بالذكاء الاصطناعي التي طُرحت حديثًا مثل Humane Pin و Rabbit R1 كانت منتجات سيئة للغاية ، مضيفًا أن المنتجات الحالية تفتقر إلى أفكار جديدة وجريئة .وأكد الرئيس التنفيذي لـOpenAI، سام ألتمان، أن أول منتج يعمل عليه الفريق ليس بديلًا للهاتف الذكي ،…..لقراءة المقال بالكامل، يرجى الضغط على زر 'إقرأ على الموقع الرسمي' أدناه

OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً
OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

أخبار مصر

timeمنذ يوم واحد

  • أخبار مصر

OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

تيك فويس | OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store