أحدث الأخبار مع #LMArena

أداء ضعيف للإصدار الأصلي من نموذج "Maverick" بعد اتهام "ميتا" بالغش

العربية

١٢-٠٤-٢٠٢٥

علوم
العربية

أداء ضعيف للإصدار الأصلي من نموذج "Maverick" بعد اتهام "ميتا" بالغش

واجهت شركة "ميتا" الأسبوع الماضي مشكلة كبيرة لاستخدامها نسخة تجريبية لم تصدرها من نموذجها الجديدة "Llama 4 Maverick" لتحقيق مستوى متقدم في اختبار "LM Arena" للأداء. ودفع هذا الأمر القائمين على منصة اختبار "LM Arena" إلى الاعتذار وتغيير سياساتهم وتقييم نموذج "Maverick" الأصلي غير المعدل. والآن، أثبت الاختبار أن نموذج "Maverick" الأصلي غير المعدل ليس منافسًا قويًا، مثلما أظهرت نتائج اختبار النسخة المعدلة سابقًا، بحسب تقرير لموقع "TechCrunch" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business". وكان أداء نموذج "Maverick" غير المُعدّل أقل من نماذج أخرى، بما في ذلك "GPT-4o" من شركة "OpenAI"، و"Claude 3.5 Sonnet" من شركة أنثروبيك، و"Gemini 1.5 Pro" من "غوغل". لكن قد يكون هناك تفسيرًا لهذا الأداء الضعيف للنسخة غير المعدلة من نموذج "Maverick". وكانت شركة ميتا قالت يوم السبت الماضي إن نموذج "Maverick" التجريبي المُعدل -ويحمل اسم "Llama-4-Maverick-03-26-Experimental"- "مُحسن للمحادثة". ويبدو أن هذه التحسينات كانت فعالة على منصة "LM Arena" حيث يجري مقيمون بشريون مقارنة لردود نماذج الذكاء الاصطناعي ويختارون أيًا من تلك النماذج يفضلونه. ولا تُعتبر منصة "LM Arena" المقياس الأكثر موثوقية لأداء نموذج ذكاء اصطناعي. علاوة على ذلك، فإنّ تخصيص نموذج ذكاء اصطناعي لاختبار -بخلاف كونه أمرًا مُضلّلًا- فإنه يُصعّب على المُطوّرين التنبؤ بدقة بمدى جودة أداء النموذج في سياقات مُختلفة. وقال متحدث باسم "ميتا"، في بيان لموقع "TechCrunch"، إن "Llama-4-Maverick-03-26-Experimental هو نسخة مُحسّنة للمحادثة اختبرناها، وتؤدي جيدًا أيضًا على (منصة) LMArena". وأضاف: "لقد أصدرنا الآن نسختنا مفتوحة المصدر وسنرى كيف يُخصّص المُطوّرون Llama 4 لحالات استخدامهم الخاصة".

معايير "ميتا" لنماذجها الجديدة من الذكاء الاصطناعي قد تكون مضللة

المغرب اليوم

٠٧-٠٤-٢٠٢٥

علوم
المغرب اليوم

معايير "ميتا" لنماذجها الجديدة من الذكاء الاصطناعي قد تكون مضللة

حلّ "Maverick"، أحد نماذج الذكاء الاصطناعي الرائدة الجديدة التي أطلقتها شركة ميتا يوم السبت، في المرتبة الثانية بمنصة "LM Arena"، وهي اختبار يُجري فيه مُقيّمون بشريون مقارنة لمخرجات النماذج ويختارون أيًا منها يُفضّلونه. لكن يبدو أن نسخة نموذج "Maverick" التي نشرتها "ميتا" على منصة "LM Arena" تختلف عن الإصدار المُتاح على نطاق واسع للمطورين. وكما أشار العديد من باحثي الذكاء الاصطناعي على منصة إكس (تويتر سابقًا)، ذكرت "ميتا" في إعلانها أن "Maverick" على منصة "LM Arena" هو "إصدار تجريبي للدردشة. لكن يكشف رسم بياني على موقع "Llama" الرسمي أن الاختبار الذي أجرته "ميتا" على منصة "LM Arena " أُجري باستخدام نموذج "Llama 4 Maverick المحسن للمحادثة"، بحسب تقرير لموقع "TechCrunch" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business". ولأسباب مُختلفة، لم يُعتبر اختبار منصة "LM Arena" يومًا المقياس الأكثر موثوقية لأداء نموذج الذكاء الاصطناعي. لكن شركات الذكاء الاصطناعي عمومًا لم تقم بتخصيص أو تحسين نماذجها لتحقيق نتائج أفضل على هذه المنصة أو على الأقل لم تعترف بذلك. تكمن مشكلة تخصيص نموذج لمعيار، ثم حجبه، ثم إصدار نسخة "عادية" منه في صعوبة التنبؤ بدقة بأداء النموذج في سياقات معينة، فضلًا عن كونه أمرًا مضللًا, ويقدم المعيار المثالي -على الرغم من قلة كفايته- لمحة عامة عن نقاط قوة وضعف نموذج واحد عبر مجموعة من المهام. وفي الواقع، لاحظ الباحثون على منصة إكس اختلافات واضحة في أداء نموذج "Maverick" المتاح للتنزيل عامة للمستخدمين مقارنة بالنموذج المُستضاف على منصة "LM Arena". ويبدو أن إصدار "LM Arena" يستخدم الكثير من رموز الإيموجي، ويقدم إجابات مطولة للغاية. قد يهمك أيضـــــــا

«غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟

أخبار ليبيا

٢٧-٠٣-٢٠٢٥

علوم
أخبار ليبيا

«غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟

أعلنت شركة 'غوغل'، 'عن نموذج 'ذكاء اصطناعي' جديد طوّرته ليقدم للمستخدمين ميزات وقدرات فائقة في معالجة البيانات'. وأشارت 'غوغل'، 'إلى أن نموذج Gemini 2.5 Pro يعتبر أحدث جيل من نماذج الذكاء الاصطناعي المصممة للاستدلال والتفكير العميق قبل تقديم الإجابات للمستخدمين'. ووفق الشركة، 'بالمقارنة مع النماذج السابقة، مثل Gemini 2.0 Flash Thinking، يُظهر النموذج الجديد تقدما كبيرا، فتبعا لغوغل فإن هذا النموذج تفوّق في اختبارات LMArena المخصصة لمعرفة الأشياء التي يفضلها المستخدم، وكذلك في اختبارات AIME 2025 للرياضيات، واختبارات وGPQA diamond للعلوم، واحتل المركز الأول في اختبارات Humanity's Last Exam التي تقيس إمكانية المعرفة والتحليل المنطقي للبرمجيات'. ونوهت الشركة 'إلى أن جميع نماذجها القادمة للذكاء الاصطناعي ستعتمد على تقنيات الاستدلال المنطقي، وأن نموذج Gemini 2.5 Pro سيكون متاحا للمطورين عبر منصة Google AI Studio، وكذلك لمستخدمي تطبيق Gemini عبر اشتراكات Gemini Advanced المدفوعة، والتي تبلغ قيمة الاشتراك فيها 20 دولارا شهريا'. هذا ويرى الخبراء، 'أن نموذج Gemini 2.5 الجديد من غوغل سيكون منافسا قويا لنماذج o1 من OpenAI ونماذج 'الذكاء الاصطناعي' الجديدة التي أعلنت عنها 'ميتا' وغيرها من الشركات الرائدة في مجال البرمجيات'. The post «غوغل» تكشف أحدث نماذجها لـ«الذكاء الاصطناعي».. ما ميزاته؟ appeared first on عين ليبيا | آخر أخبار ليبيا. يمكنك ايضا قراءة الخبر في المصدر من موقع عين ليبيا

Gemini 2.5 Pro.. جوجل تكشف عن "أذكى" نماذجها للذكاء الاصطناعي

الشرق السعودية

٢٧-٠٣-٢٠٢٥

علوم
الشرق السعودية

Gemini 2.5 Pro.. جوجل تكشف عن "أذكى" نماذجها للذكاء الاصطناعي

كشفت شركة جوجل عن أحدث ابتكاراتها في مجال الذكاء الاصطناعي، بإطلاق النموذج المتطور Gemini 2.5 Pro، والذي وصفته بأنه "أذكى نماذجها على الإطلاق"، إذ يتمتع بقدرات فائقة في التفكير المنطقي، وحل المشكلات المعقدة. النموذج الجديد، الذي أُعلن عنه في نسخة تجريبية تحت اسم Gemini 2.5 Pro Experimental، يُعد تطوراً كبيراً في سلسلة نماذج Gemini، إذ يتصدر قائمة الأداء في منصة LMArena، التي تقيس تفضيلات المستخدمين البشريين، متفوقاً على منافسين بارزين مثل GPT-4.5 من OpenAI، وClaude 3.7 Sonnet من أنثروبيك، وجروك من xAI. Gemini 2.5 Pro يمثل Gemini 2.5 Pro نقلة نوعية في تصميم النماذج الذكية، إذ يعتمد على نهج "نماذج التفكير"، وهي فئة من النماذج قادرة على المرور بعمليات تفكير داخلية وتحليلية قبل تقديم الإجابات، مما يسهم في تحسين دقة الأداء واستجابته للسياقات المعقدة. وأوضحت الشركة أن مفهوم "القدرة على التفكير" في الذكاء الاصطناعي يتجاوز مجرد التصنيف أو التنبؤ، ليشمل تحليل المعلومات، واستخلاص النتائج المنطقية، وفهم السياق، واتخاذ قرارات مبنية على معطيات دقيقة، بحسب المدونة الرسمية لجوجل. وقدمت جوجل في وقت سابق نموذج Gemini 2.0 Flash Thinking كنموذج أولي لهذه الفئة من النماذج، قبل أن تصل الآن إلى مستوى جديد من الأداء من خلال Gemini 2.5 Pro، الذي يعتمد على نموذج أساسي مُعزز وتقنيات تدريب لاحقة محسّنة. تفوق واضح النموذج الجديد Gemini 2.5 Pro يُظهر تفوقاً واضحاً في اختبارات البرمجة، والرياضيات، والعلوم. على سبيل المثال، سجّل النموذج نسبة 63.8% في اختبار SWE-Bench Verified، وهو معيار صناعي لتقييم أداء النماذج في تطوير التطبيقات البرمجية التفاعلية، وذلك باستخدام إعداد مخصص للوكيل الذكي. كما حقق أداء متقدماً في اختبارات رياضية وعلمية مثل GPQA وAIME 2025، دون الحاجة لاستخدام تقنيات اختبار مكلفة مثل "التصويت بالأغلبية". وفي اختبار Humanity's Last Exam، وهو مجموعة بيانات صممها مئات الخبراء لقياس حدود المعرفة البشرية، حقق النموذج نتيجة قياسية بلغت 18.8% بين النماذج التي لا تستخدم أدوات مساعدة. قدرات البرمجة المتقدمة وتمكنت "ديب مايند" من تحقيق قفزة نوعية في مجال البرمجة، إذ تفوق Gemini 2.5 Pro على النسخة السابقة "2.0"، وبرز في إنشاء تطبيقات ويب جذابة بصرياً، إلى جانب تطبيقات برمجية تعتمد على الوكلاء الأذكياء، فضلاً عن قدراته في تحويل وتحرير الشيفرات البرمجية. ومن أبرز المميزات التي استعرضتها الشركة، قدرة النموذج على إنشاء لعبة فيديو من خلال توليد الشيفرة التنفيذية الكاملة انطلاقاً من جملة وصفية واحدة فقط، مستفيداً من قدراته على التفكير المنطقي والتحليلي. إطار متعدد الوسائط يستند Gemini 2.5 Pro إلى خصائص "النموذج متعدد الوسائط" Multimodal، ويتميّز بإمكانية التعامل مع نطاق واسع من المعلومات، بما في ذلك النصوص، والصوت، والصور، والفيديو، وحتى مستودعات الشيفرات البرمجية بأكملها. وتعمل نسخة Gemini 2.5 Pro بقدرة على تحليل ما يصل إلى مليون "توكن" في جلسة واحدة، مع خطط لإطلاق نسخة تدعم تحليل مليوني "توكن" قريباً، وهو ما يمكّن النموذج من معالجة كميات ضخمة من البيانات ودمج مصادر معلومات متعددة لفهم أعمق وأدق. وأعلنت جوجل إتاحة نموذجها الجديد "Gemini 2.5 Pro Experimental" على منصة Google AI Studio، وعبر تطبيق جيميناي على الهواتف الذكية والحواسيب المكتبية لمشتركي خدمة Gemini Advanced المدفوعة، كما سيتم إطلاقه قريباً عبر منصة Vertex AI. وأكدت الشركة أنها ستعلن عن تفاصيل التسعير خلال الأسابيع المقبلة، ما سيمنح المستخدمين إمكانيات أوسع للاستفادة من النموذج بمعدلات استخدام أعلى لأغراض الإنتاج واسعة النطاق.

جوجل تطلق Gemini 2.5 Pro.. أقوى نموذج ذكاء اصطناعي حتى الآن

اليوم السابع

٢٦-٠٣-٢٠٢٥

علوم
اليوم السابع

جوجل تطلق Gemini 2.5 Pro.. أقوى نموذج ذكاء اصطناعي حتى الآن

أعلنت Google رسميًا عن إطلاق Gemini 2.5 Pro ، أحدث وأقوى نموذج ذكاء اصطناعي طورته حتى الآن، مما يمثل قفزة نوعية في عالم الذكاء الاصطناعي، ويتميز الإصدار الجديد بقدرات تفكير متقدمة، حيث يمكنه معالجة المهام خطوة بخطوة واتخاذ قرارات أكثر دقة وذكاءً، مما يحسن جودة الردود ودقتها عند التعامل مع المهام المعقدة. قدرات Gemini 2.5 Pro الجديدة في بيانها الرسمي، أوضحت Google أن Gemini 2.5 Pro يعد نموذجها الأكثر تقدمًا حتى الآن للمهام المعقدة، حيث تصدّر لوحة صدارة LMArena—وهو مقياس يحدد تفضيلات المستخدمين البشر—بهامش كبير، مما يعكس مستوى ذكاء وأداء متطورًا، كما يتفوق النموذج الجديد في حل المسائل الرياضية وكتابة الأكواد البرمجية، متصدرًا معايير AIME 2025 للرياضيات وGPQA diamond للعلوم. Google وصفت جميع نماذج Gemini 2.5 بأنها 'نماذج تفكير' قادرة على تحليل المعلومات والتفكير المنطقي قبل تقديم الردود، مما يحسن من أداء الذكاء الاصطناعي بشكل عام. وصرحت الشركة بأنها تعمل على دمج هذه القدرات في جميع نماذجها المستقبلية، مما يعزز من دقة وتفوق هذه الأنظمة في معالجة المهام المعقدة ودعم الوكلاء الذكيين (context-aware agents). تحسينات رئيسية في Gemini 2.5 Pro 1. قدرات برمجية فائقة • يعتبر قفزة نوعية عن الإصدار السابق (Gemini 2.0) من حيث إنتاج الأكواد البرمجية وتعديلها وتحويلها. • يتميز بقدرته على تصميم تطبيقات ويب ديناميكية ومتقدمة، مما يجعله أداة قوية للمطورين ومهندسي البرمجيات. • سجل 63.8% في اختبار SWE-Bench Verified لتقييم قدرات البرمجة، وهو أحد أعلى الدرجات في هذا المجال. 2. أداء متطور في التفكير المنطقي • يتمتع Gemini 2.5 Pro بقدرة عالية على تحليل المشكلات الرياضية والعلمية، متجاوزًا نماذج الذكاء الاصطناعي الأخرى في اختبارات مثل AIME 2025 وGPQA diamond. 3. دعم للنماذج متعددة الوسائط • يعتمد Gemini 2.5 على نظام متعدد الوسائط يسمح له بفهم النصوص والصور والفيديوهات، مما يعزز من كفاءته في التعامل مع البيانات المختلفة. 4. توسعة سياق الفهم إلى مليون رمز (Token Context Window) • يدعم الآن سياقًا يمتد إلى 1 مليون رمز، مما يجعله قادرًا على معالجة بيانات ضخمة بذكاء ودقة أكبر. • ستتم زيادة هذا النطاق إلى 2 مليون رمز قريبًا، مما سيحسن من قدرة النموذج على التعامل مع نصوص طويلة ومعقدة. إتاحة Gemini 2.5 Pro للمستخدمين أعلنت Google أن Gemini 2.5 Pro أصبح متاحًا الآن عبر Google AI Studio وتطبيق Gemini لمشتركي Gemini Advanced. كما سيتم دمجه قريبًا في منصة Vertex AI لتوفير تجربة ذكاء اصطناعي محسنة للمطورين والشركات. بالإضافة إلى ذلك، صرّحت الشركة بأنها ستكشف قريبًا عن تفاصيل الأسعار، مما سيمكن المستخدمين من الوصول إلى مستويات استخدام أعلى تناسب التطبيقات الإنتاجية واسعة النطاق. يُعتبر Gemini 2.5 Pro خطوة كبيرة نحو تطوير نماذج ذكاء اصطناعي أكثر ذكاءً وقوة، حيث يجمع بين قدرات برمجية وتحليلية متقدمة مع تحسينات كبيرة في التعلم العميق والتفاعل مع المستخدمين. مع استمرار Google في تطوير تقنياتها، يبدو أن المستقبل يحمل مزيدًا من التطورات في عالم الذكاء الاصطناعي، مما سيؤثر بشكل كبير على مجالات مثل البرمجة، والبحث العلمي، وتحليل البيانات.