هل بالغت OpenAI في أداء o3؟ نتائج FrontierMath تكشف عن 10% فقط

أظهر نموذج الذكاء الاصطناعي o3 من
OpenAI
، الذي صدر الأسبوع الماضي، أداءً ضعيفًا في معيار محدد، حيث أشارت شركة Epoch AI، الشركة المسئولة عن معيار FrontierMath، إلى أن النسخة المتاحة للجمهور من نموذج الذكاء الاصطناعي o3 حققت 10% في الاختبار، وهي نسبة أقل بكثير من ادعاء الشركة عند الإطلاق.
وكان مارك تشين، كبير مسؤولي الأبحاث في شركة الذكاء الاصطناعي ومقرها سان فرانسيسكو، قد صرّح بأن النموذج حقق 25% في الاختبار، محققًا رقمًا قياسيًا جديدًا، ومع ذلك، فإن هذا التباين لا يعني أن OpenAI كذبت بشأن هذا المقياس.
وفي ديسمبر 2024، أجرت
OpenAI
بثًا مباشرًا على يوتيوب ومنصات التواصل الاجتماعي الأخرى، للإعلان عن نموذج الذكاء الاصطناعي o3، وفي ذلك الوقت، سلّطت الشركة الضوء على مجموعة القدرات المُحسّنة في نموذج اللغة الكبير (LLM)، وتحديدًا، أدائه المُحسّن في الاستعلامات القائمة على الاستدلال.
ومن الطرق التي جسّدت بها الشركة هذا الادعاء مشاركة نتائج النموذج المرجعية عبر اختبارات شائعة مُختلفة، ومن بين هذه الاختبارات اختبار FrontierMath، الذي طورته شركة Epoch AI. يُعرف هذا الاختبار الرياضي بصعوبته وقدرته على التلاعب، حيث طوّره أكثر من 70 عالم رياضيات، وجميع المسائل فيه جديدة وغير منشورة، والجدير بالذكر أنه حتى ديسمبر، لم يُجْزِ أي نموذج ذكاء اصطناعي أكثر من 9% من الأسئلة في محاولة واحدة.
ومع ذلك، عند إطلاقه، ادّعى تشين أن o3 تمكّنت من تحقيق رقم قياسي جديد بتسجيلها 25% في الاختبار، ولم يكن التحقق الخارجي من الأداء ممكنًا في ذلك الوقت، نظرًا لعدم توفر النموذج في المجال العام، وبعد إطلاق o3 وo4-mini الأسبوع الماضي، نشرت شركة
Epoch AI
منشورًا على منصة X (المعروفة سابقًا باسم تويتر)، مدّعيةً أن نموذج o3، في الواقع، قد حقق 10% في الاختبار.
ومع أن نسبة 10% تجعل نموذج الذكاء الاصطناعي الأعلى تصنيفًا في الاختبار، إلا أن هذا الرقم أقل من نصف ما ادّعته الشركة، وقد دفع هذا المنشور العديد من المتحمسين للذكاء الاصطناعي إلى الحديث عن صحة نتائج اختبارات الأداء المعيارية.
ولا يعني هذا التباين أن OpenAI كذبت بشأن أداء نموذج الذكاء الاصطناعي الخاص بها، بل على العكس، من المرجح أن نموذج شركة الذكاء الاصطناعي غير المُصدر استخدم قدرات حوسبة أعلى للحصول على هذه النتيجة، ومع ذلك، يُرجّح أن النسخة التجارية من النموذج قد عُدّلت لتكون أكثر كفاءة في استهلاك الطاقة، وفي هذه العملية، تم تخفيف بعض أدائها.
على صعيد منفصل، نشرت ARC Prize، وهي المنظمة التي تقف وراء اختبار ARC-AGI المعياري، الذي يختبر الذكاء العام لنموذج الذكاء الاصطناعي، أيضًا على منصة X حول هذا التباين، وأكد المنشور أن "نموذج o3 الصادر يختلف عن النموذج الذي اختبرناه في ديسمبر 2024".
وزعمت الشركة أن مستويات الحوسبة في نموذج o3 الصادر أصغر من الإصدار الذي اختبرته. ومع ذلك، أكدت أن o3 لم يُدرّب على بيانات ARC-AGI، حتى في مرحلة ما قبل التدريب.
وأعلنت جائزة ARC أنها ستعيد اختبار نموذج الذكاء الاصطناعي o3 الصادر وستنشر النتائج المحدثة. كما ستعيد الشركة اختبار نموذج o4-mini، وستصنف النتائج السابقة على أنها "معاينة"، وليس من المؤكد أن أداء الإصدار الصادر من o3 سيكون دون المستوى في هذا الاختبار أيضًا.

هاشتاغز

علوم

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

أخبار ذات صلة

OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

أخبار مصر

منذ 16 ساعات

أخبار مصر

OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

تيك فويس | OpenAI تعلن رسميا ان جوني ايف سينضم لهم. وهم يعملون على جهاز جديد كليا بعالم AI. بدلا من انك تكون مع صديقك وتضطر تطلع جوالك عشان تسال ال ai سؤال. يبغون شي اسرع واكثر حضوراً معك. ويبدو انه هو الجهاز الذي سيعلن عنه. لكن ماذكروا كل التفاصيل حالياً

OpenAI تستحوذ على شركة Jony Ive ب 6.4 مليار دولار، وتخطف مُصمّم آبل

أخبار مصر

منذ 16 ساعات

أخبار مصر

OpenAI تستحوذ على شركة Jony Ive ب 6.4 مليار دولار، وتخطف مُصمّم آبل

OpenAI تستحوذ على شركة Jony Ive ب 6.4 مليار دولار، وتخطف مُصمّم آبل أعلنت شركة OpenAI اليوم الأربعاء عن استحواذها على شركة io -الشركة الناشئة المُتخصصّة في أجهزة الذكاء الاصطناعي والمملوكة للمُصمّم الشهير جوني آيف 'Jony Ive'- مُقابل 6.4 مليار دولار أمريكي، في صفقة تشمل حصة OpenAI الحالية في الشركة.بين المجانية والربحية – رحلة OpenAI نحو المستقبل القصة الكاملة لعداء إيلون ماسك مع OpenAI و Sam Altmanتفاصيل الصفقة والاندماجوفقًا لبيانٍ صادر عن OpenAI، سيتولّى آيف 'مسؤوليات إبداعية وتصميمية عميقة' داخل كلٍ من OpenAI وio، بينما ستبقى شركته الإبداعية LoveFrom مُستقلة.وأوضحت الشركة أن io ستنضم إلى OpenAI، والذي سيُمكّن فريقها من العمل بشكل وثيق مع فرق البحث والهندسة في سان فرانسيسكو.وفي منشور مُشترك على مدونة الشركة، ذكر سام ألتمان (الرئيس التنفيذي لـ OpenAI) وجوني آيف أنّ شركة io تأسّست قبل عام بمُشاركة عدد من خريجي آبل، منهم سكوت كانون وتانغ تان وإيفانز هانكي، الذين شغلوا مناصب قيادية في آبل بعد مُغادرة آيف.القيمة والاستثمارات السابقةستدفع OpenAI مبلغ 5 مليارات دولار مُقابل الصفقة، نظرًا لامتلاكها بالفعل 23 من أسهم io.يُعد هذا الاستحواذ الأكبر في تاريخ OpenAI، حيث يأتي بعد أسابيع فقط من شرائها أداة البرمجة المدعومة بالذكاء الاصطناعي Windsurf مُقابل 3 مليارات دولار. وقبل ذلك، استحوذت الشركة على Rockset المُتخصصّة في قواعد البيانات التحليلية عام 2024، دون الكشف عن قيمة…..لقراءة المقال بالكامل، يرجى الضغط على زر 'إقرأ على الموقع الرسمي' أدناه

مصمم iPhone Jony Ive انضم إلى Openai كجزء من صفقة 6.5 مليار دولار

وكالة نيوز

منذ 17 ساعات

وكالة نيوز

مصمم iPhone Jony Ive انضم إلى Openai كجزء من صفقة 6.5 مليار دولار

انضم Jony Ive ، وهو تصميم Apple Industrial Design السابق الشهير خلف مظهر iPhone و iPad وغيرها من منتجات التكنولوجيا العملاقة ، إلى Openai كجزء من صفقة بقيمة 6.5 مليار دولار من شأنها أن تندمج شركة Ive's Startup مع شركة Sam Altman. سوف تساعد IVE شركة الذكاء الاصطناعي ، التي طورت chatgpt ، تشغيل أجهزة مع قدرة الذكاء الاصطناعي ، وفقا لمقطع فيديو تم نشره على Openai's حساب x يوم الاربعاء. كجزء من الصفقة ، أعلنت Openai أنها ستحصل على IV's Startup IO ، وفقًا لـ A إفادة أرسلت بواسطة Openai. سيقود إيف وفريق بدء التشغيل جهود التصميم في شركة الذكاء الاصطناعى. وقال ألتمان ، الرئيس التنفيذي لشركة Openai ، في الفيديو: 'قبل عامين ، بدأت أنا وجوني نتحدث عن ما كان يبدو عليه مستقبل الذكاء الاصطناعي وأنواع جديدة من أجهزة الكمبيوتر'. 'أصبح من الواضح بسرعة كبيرة لكلا منا أننا بحاجة إلى شركة ثالثة.' وقال ألتمان إن مهمتهم هي إنشاء عائلة من الأجهزة التي تسمح للناس باستخدام الذكاء الاصطناعي 'لإنشاء جميع أنواع الأشياء الرائعة' ، مشيرًا إلى أن Ive وفريقه قد طوروا بالفعل جهازًا أوليًا. عملت في Apple لأكثر من عقدين من الزمن ، وهو معروف بعمله على iPhone الأيقونية و IMAC وغيرها من التصميمات. كان كبير مسؤولي التصميم في Apple قبل مغادرته الشركة في عام 2019 لبدء شركة التصميم الخاصة به ، والتي تسمى LoveFrom. ساهم في هذا التقرير.