logo
#

أحدث الأخبار مع #AIME2025

«غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟
«غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟

أخبار ليبيا

time٢٧-٠٣-٢٠٢٥

  • علوم
  • أخبار ليبيا

«غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟

أعلنت شركة 'غوغل'، 'عن نموذج 'ذكاء اصطناعي' جديد طوّرته ليقدم للمستخدمين ميزات وقدرات فائقة في معالجة البيانات'. وأشارت 'غوغل'، 'إلى أن نموذج Gemini 2.5 Pro يعتبر أحدث جيل من نماذج الذكاء الاصطناعي المصممة للاستدلال والتفكير العميق قبل تقديم الإجابات للمستخدمين'. ووفق الشركة، 'بالمقارنة مع النماذج السابقة، مثل Gemini 2.0 Flash Thinking، يُظهر النموذج الجديد تقدما كبيرا، فتبعا لغوغل فإن هذا النموذج تفوّق في اختبارات LMArena المخصصة لمعرفة الأشياء التي يفضلها المستخدم، وكذلك في اختبارات AIME 2025 للرياضيات، واختبارات وGPQA diamond للعلوم، واحتل المركز الأول في اختبارات Humanity's Last Exam التي تقيس إمكانية المعرفة والتحليل المنطقي للبرمجيات'. ونوهت الشركة 'إلى أن جميع نماذجها القادمة للذكاء الاصطناعي ستعتمد على تقنيات الاستدلال المنطقي، وأن نموذج Gemini 2.5 Pro سيكون متاحا للمطورين عبر منصة Google AI Studio، وكذلك لمستخدمي تطبيق Gemini عبر اشتراكات Gemini Advanced المدفوعة، والتي تبلغ قيمة الاشتراك فيها 20 دولارا شهريا'. هذا ويرى الخبراء، 'أن نموذج Gemini 2.5 الجديد من غوغل سيكون منافسا قويا لنماذج o1 من OpenAI ونماذج 'الذكاء الاصطناعي' الجديدة التي أعلنت عنها 'ميتا' وغيرها من الشركات الرائدة في مجال البرمجيات'. The post «غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟ appeared first on عين ليبيا | آخر أخبار ليبيا. يمكنك ايضا قراءة الخبر في المصدر من موقع عين ليبيا

جدل حول دقة معايير الذكاء الاصطناعي وأداء النماذج الجديدة
جدل حول دقة معايير الذكاء الاصطناعي وأداء النماذج الجديدة

صراحة نيوز

time٢٤-٠٢-٢٠٢٥

  • علوم
  • صراحة نيوز

جدل حول دقة معايير الذكاء الاصطناعي وأداء النماذج الجديدة

صراحة نيوزـ تصاعدت المناقشات حول معايير الذكاء الاصطناعي وطريقة الإبلاغ عنها، بعدما اتهم موظف في شركة 'OpenAI' شركة 'xAI' التابعة لإيلون ماسك بنشر نتائج مضللة حول أداء أحدث نموذج ذكاء اصطناعي لها، 'غروك 3'. جاء ذلك بعد نشر xAI رسمًا بيانيًا يوضح أداء 'Grok 3' في AIME 2025، وهي مجموعة من أسئلة الرياضيات الصعبة. رغم دفاع إيغور بابوشكين، المؤسس المشارك في xAI، عن صحة النتائج، أشار موظفو 'OpenAI' على منصة إكس إلى أن الرسم البياني أغفل ذكر درجة AIME 2025 لنموذج 'o3-mini-high' في اختبار 'cons@64'. كما تبين أن درجات 'Grok 3 Reasoning Beta' و'Grok 3 mini Reasoning' في AIME 2025 عند '@1' أقل من درجة 'o3-mini-high'. يأتي هذا في وقت تُستخدم فيه اختبارات AIME لاستكشاف قدرات الذكاء الاصطناعي في الرياضيات، إلا أن بعض الخبراء شككوا في صحتها كمعيار موثوق. من جانبه، اتهم بابوشكين شركة 'OpenAI' بنشر مخططات معيارية مضللة في الماضي عند مقارنة أداء نماذجها الخاصة.

هل كذبت شركة xAI بشأن معايير "غروك 3"؟
هل كذبت شركة xAI بشأن معايير "غروك 3"؟

العربية

time٢٤-٠٢-٢٠٢٥

  • علوم
  • العربية

هل كذبت شركة xAI بشأن معايير "غروك 3"؟

لقد انتشرت المناقشات حول معايير الذكاء الاصطناعي، وكيف يتم الإبلاغ عنها من قبل مختبرات الذكاء الاصطناعي. هذا الأسبوع، اتهم أحد موظفي "OpenAI" شركة الذكاء الاصطناعي"xAI" التابعة لإيلون ماسك، بنشر نتائج معايير مضللة لأحدث نموذج للذكاء الاصطناعي، "غروك 3". بينما أصر أحد المؤسسين المشاركين لشركة xAI، إيغور بابوشكين، على أن الشركة كانت على حق، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business". في منشور على مدونة "xAI"، نشرت الشركة رسمًا بيانيًا يوضح أداء "غروك 3" في AIME 2025، وهي مجموعة من أسئلة الرياضيات الصعبة من اختبار رياضيات. شكك بعض الخبراء في صحة اختبارات AIME كمعيار للذكاء الاصطناعي. ومع ذلك، تُستخدم AIME 2025 والإصدارات الأقدم من الاختبار بشكل شائع لاستكشاف قدرة النموذج على الرياضيات. أظهر الرسم البياني الخاص بشركة xAI نسختين من Grok 3، Grok 3 Reasoning Beta و Grok 3 mini Reasoning، متفوقين على أفضل نموذج متاح أداءً من o3-mini-high، في AIME 2025. لكن موظفي "OpenAI" على منصة إكس أشاروا إلى أن الرسم البياني الخاص بـ "xAI" لم يتضمن درجة AIME 2025 لـ o3-mini-high في أحد نماذج الاختبارات يسمي "cons@64". ويميل "cons@64" إلى تعزيز درجات معيار الأداء للنماذج بشكل كبير، وقد يؤدي حذفه من الرسم البياني إلى جعل الأمر يبدو وكأن أحد النماذج يتفوق على الآخر بينما في الواقع، هذا ليس هو الحال. إن درجات Grok 3 Reasoning Beta و Grok 3 mini Reasoning في AIME 2025 عند "@1" - أي الدرجة الأولى التي حصلت عليها النماذج في المعيار - تقع أقل من درجة o3-mini-high. كما أن Grok 3 Reasoning Beta يتخلف قليلاً عن نموذج "o1" الذي تم ضبطه على الحوسبة المتوسطة، ومع ذلك، قالت "xAI" عن "غروك 3" أذكى ذكاء اصطناعي في العالم. زعم بابوشكين على منصة إكس أن "OpenAI" نشرت مخططات معيارية مضللة مماثلة في الماضي، وإن كانت مخططات لمقارنة أداء نماذجها الخاصة.

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store