logo
أخبار التكنولوجيا : عندما تصبح بوكيمون معيارًا: جدلية شفافية تقييم نماذج الذكاء الاصطناعى

أخبار التكنولوجيا : عندما تصبح بوكيمون معيارًا: جدلية شفافية تقييم نماذج الذكاء الاصطناعى

الخميس 17 أبريل 2025 12:01 مساءً
نافذة على العالم - في مفارقة لافتة، لم تسلم حتى لعبة بوكيمون الشهيرة من الجدل الدائر حول معايير تقييم نماذج الذكاء الاصطناعي، فقد انتشر الأسبوع الماضي منشور على منصة X بشكل واسع، زاعمًا أن نموذج Gemini من تطوير جوجل تفوق على نموذج Claude من شركة Anthropic في التقدم داخل ثلاثية ألعاب بوكيمون الأصلية.
ووفقًا للمنشور، تمكن Gemini من الوصول إلى مدينة 'Lavender Town'، بينما ظل Claude عالقًا في 'Mount Moon' منذ أواخر فبراير.
لكن، ما لم يُذكر في المنشور هو أن Gemini كان يملك أفضلية تقنية. فقد أشار عدد من مستخدمي Reddit إلى أن المطور المسؤول عن بث Gemini على منصة Twitch قام بتطوير خريطة مصغّرة مخصصة تساعد النموذج في التعرف على العناصر داخل اللعبة، مثل الأشجار القابلة للقطع. هذه الأداة تقلل من الحاجة لتحليل الصور قبل اتخاذ القرارات، مما يمنح Gemini تفوقًا واضحًا.
ورغم أن استخدام لعبة بوكيمون كمعيار أداء للذكاء الاصطناعي يُعد أمرًا شبه هزلي، إلا أنه يسلط الضوء على نقطة جوهرية: كيفية تنفيذ التقييم يمكن أن تؤثر بشكل كبير على النتائج النهائية.
فعلى سبيل المثال، أعلنت شركة Anthropic عن نتيجتين مختلفتين لنموذج Claude 3.7 Sonnet في اختبار SWE-bench Verified، المصمم لتقييم قدرات النماذج على البرمجة. سجل النموذج دقة بلغت 62.3%، بينما ارتفعت إلى 70.3% عند استخدام هيكل مخصص طورته الشركة.
وفي خطوة مشابهة، قامت شركة Meta مؤخرًا بتعديل نسخة من نموذجها Llama 4 Maverick خصيصًا لتحسين أدائه في معيار LM Arena. واللافت أن النسخة العادية من النموذج سجلت أداءً أقل بكثير في نفس التقييم.
هذه الحالات تكشف عن مشكلة أعمق: معايير التقييم ليست مثالية أصلًا، واستخدام أدوات مخصصة أو غير قياسية قد يزيد من تعقيد المقارنات بين النماذج الجديدة، مما يجعل عملية تقييم الذكاء الاصطناعي أقل شفافية وأكثر جدلية بمرور الوقت.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

أخبار التكنولوجيا : جوجل تختبر محادثات صوتية بالذكاء الاصطناعى فى الوقت الفعلى بميزة البحث
أخبار التكنولوجيا : جوجل تختبر محادثات صوتية بالذكاء الاصطناعى فى الوقت الفعلى بميزة البحث

نافذة على العالم

timeمنذ ساعة واحدة

  • نافذة على العالم

أخبار التكنولوجيا : جوجل تختبر محادثات صوتية بالذكاء الاصطناعى فى الوقت الفعلى بميزة البحث

الجمعة 20 يونيو 2025 02:30 صباحاً نافذة على العالم - تدمج جوجل ميزة البحث المباشر (Search Live) ضمن وضع الذكاء الاصطناعي، مما يتيح لك إجراء محادثة صوتية مباشرة مع روبوت الدردشة الذكي الخاص بالشركة مباشرةً من محرك البحث، هذا الاختبار الذي يُطرح حاليًا لمستخدمي Labs في الولايات المتحدة، لا يدعم حاليًا مشاركة الكاميرا، لكن جوجل تخطط لإضافة هذه الميزة خلال الأشهر المقبلة. تتيح لك ميزة البحث المباشر التفاعل مع إصدار الشركة "المخصص" من جيميني والبحث في الويب فورًا، و تتوفر هذه الميزة حاليًا في تطبيق جوجل على نظامي أندرويد وiOS، حيث تُحسّن التجربة بتمكينك من توجيه الكاميرا إلى شيء ما وطرح أسئلة عنه بصوت عالٍ. وأعلنت جوجل لأول مرة عن خططها لإضافة ميزة البحث المباشر إلى وضع الذكاء الاصطناعي، وهي ميزة بحث مدعومة بالذكاء الاصطناعي، والتي طُرحت للجميع في الولايات المتحدة الشهر الماضي ، ويُعد هذا جزءًا من التحول الأوسع الذي تُجريه جوجل لمحرك بحثها، والذي يُجري أيضًا تجارب لإضافة لمحات صوتية شبيهة بالبودكاست إلى نتائج البحث . يمكنك تجربة البحث المباشر في وضع الذكاء الاصطناعي من خلال تفعيل تجربة وضع الذكاء الاصطناعي في مختبرات جوجل ، بعد ذلك، توجه إلى تطبيق جوجل على نظامي أندرويد أو iOS واضغط على أيقونة "البحث المباشر ، يمكنك بعد ذلك طرح سؤال بصوت عالٍ، مثل "ما هي بعض النصائح لمنع تجعد فستان الكتان في حقيبة السفر؟". سيُقدم روبوت الدردشة بالذكاء الاصطناعي ردًا صوتيًا يُمكنك الرد عليه بسؤال آخر ذي صلة، مثل "ماذا أفعل إذا استمر التجعد؟". كما سيعرض لك البحث المباشر روابط ذات صلة أثناء الدردشة ، كما أنفقت شركات ذكاء اصطناعي أخرى وقتًا في تطوير أوضاع صوتية لنماذج الذكاء الاصطناعي الخاصة بها، حيث أطلقت OpenAI وضعًا صوتيًا متقدمًا في ChatGPT العام الماضي، وأطلقت Anthropic وضعًا صوتيًا لتطبيق Claude في مايو ، وتعمل Apple أيضًا على تطوير "LLM Siri"، ولكن تأخر إطلاقه لعدم تمكن الشركة من "تحقيق الموثوقية" التي كانت ترغب بها، وفقًا لنائب الرئيس الأول لبرامج Apple، كريج فيديريغي . وتقول جوجل، إن ميزة البحث المباشر تعمل في الخلفية، مما يتيح لك متابعة محادثتك مع روبوت المحادثة أثناء التنقل بين التطبيقات الأخرى ، ويمكنك أيضًا الضغط على زر "النص" للاطلاع على نسخة نصية من الرد والرد عليه بالكتابة ، وستحفظ جوجل محادثات البحث المباشر السابقة في سجل وضع الذكاء الاصطناعي.

أخبار التكنولوجيا : يوتيوب شورتس يدمج نموذج الفيديو Veo 3 المدعوم بالذكاء الاصطناعى لإنشاء المحتوى قريبًا
أخبار التكنولوجيا : يوتيوب شورتس يدمج نموذج الفيديو Veo 3 المدعوم بالذكاء الاصطناعى لإنشاء المحتوى قريبًا

نافذة على العالم

timeمنذ ساعة واحدة

  • نافذة على العالم

أخبار التكنولوجيا : يوتيوب شورتس يدمج نموذج الفيديو Veo 3 المدعوم بالذكاء الاصطناعى لإنشاء المحتوى قريبًا

الجمعة 20 يونيو 2025 02:30 صباحاً نافذة على العالم - تستعد منصة يوتيوب لاتخاذ خطوة كبيرة في مجال إنشاء المحتوى المدعوم بالذكاء الاصطناعي، حيث أعلنت أنها ستدمج نموذج الفيديو الجديد Veo 3، المطور من قبل جوجل، في خدمة "شورتس" خلال الصيف الجاري، وستمكن هذه التقنية المستخدمين من إنتاج مقاطع فيديو كاملة تشمل العناصر المرئية والصوتية اعتمادًا فقط على أوامر نصية. وقد جاء الإعلان على لسان الرئيس التنفيذي ليوتيوب نيل موهان، خلال مشاركته في مهرجان "كان ليونز للإبداع 2025"، مما يعكس التوجه المتزايد من جوجل نحو دعم المبدعين عبر أدوات توليد المحتوى الذكية. يختلف Veo 3 عن النسخة السابقة Veo 2 التي اقتصرت على توليد الخلفيات عبر ميزة Dream Screen، إذ يتيح النموذج الجديد إنشاء فيديوهات متكاملة، تشمل تحسينات في الجودة البصرية ودمج الصوت داخل الفيديو. وحتى الآن، لم توضح يوتيوب ما إذا كانت هذه الميزة ستتطلب اشتراكًا مدفوعًا ضمن باقات AI Ultra أو AI Pro، وهو أمر محتمل خاصة أن استخدام النموذج في خدمات أخرى يقتصر حاليًا على هذه الفئات المدفوعة. الهدف من هذه التقنية هو إتاحة إنتاج الفيديو لأي شخص، بغض النظر عن امتلاكه لمهارات التحرير أو أدوات التصوير، من خلال كتابة نص فقط. منذ انطلاقها في عام 2021، أصبحت يوتيوب شورتس واحدة من أبرز المنافسين في سباق الفيديوهات القصيرة، إلى جانب تيك توك وإنستغرام ريلز، وكشف موهان أن شورتس تحقق حاليًا أكثر من 200 مليار مشاهدة يوميًا، ما يشير إلى جمهور ضخم قد يشهد قريبًا موجة جديدة من المحتوى الناتج عن الذكاء الاصطناعي. وترى جوجل في هذه النقلة نوعًا من التمكين للمبدعين، إذ وصف موهان صناع المحتوى بأنهم "شركات ناشئة في هوليوود"، مشددًا على أن الهدف هو تزويدهم بأدوات عصرية تخفف من الحواجز التي تعيق الإبداع. يمثل دمج Veo 3 في شورتس لحظة فارقة في صناعة المحتوى، حيث تنتقل الأداة من كونها وسيلة يستخدمها المبدع، إلى وسيلة تنتج المحتوى بدلًا عن المبدع. هذا التحول قد يفتح المجال أمام أنماط جديدة من الإبداع، خصوصًا لمن لا يمتلكون موارد إنتاج متقدمة، لكنه في الوقت ذاته يثير تساؤلًا جوهريًا حول مستقبل الأصالة: إذا كان بإمكان أي شخص إنتاج فيديو من خلال أمر نصي فقط، فما الذي يبقى من قيمة التميز الفردي؟ ومع تزايد ظهور تقنيات الذكاء الاصطناعي التوليدي في منصات مثل يوتيوب، من المرجح أن تتغير الطريقة التي نعرف بها الإبداع، وكيفية تقديره ومكافأته.

أخبار التكنولوجيا : جوجل تكشف: ذكاء Gemini يصاب بالذعر عند لعب بوكيمون
أخبار التكنولوجيا : جوجل تكشف: ذكاء Gemini يصاب بالذعر عند لعب بوكيمون

نافذة على العالم

timeمنذ ساعة واحدة

  • نافذة على العالم

أخبار التكنولوجيا : جوجل تكشف: ذكاء Gemini يصاب بالذعر عند لعب بوكيمون

الجمعة 20 يونيو 2025 02:30 صباحاً نافذة على العالم - في تجربة طريفة ومثيرة للاهتمام، كشفت شركة Google DeepMind أن نموذج الذكاء الاصطناعي Gemini 2.5 Pro يظهر سلوكًا يشبه 'الذعر' عند مواجهة مواقف صعبة داخل لعبة بوكيمون الكلاسيكية، ما يؤدي إلى تدهور ملحوظ في قدراته على اتخاذ القرار أثناء اللعب. ويأتي هذا الكشف ضمن تقرير أعدّته الشركة لمقارنة أداء النماذج الحديثة للذكاء الاصطناعي أثناء محاولتها لعب ألعاب الفيديو القديمة، وتحديدًا سلسلة بوكيمون التي مضى على إصدارها أكثر من 25 عامًا. والنتيجة؟ الذكاء الاصطناعي لا يزال يواجه تحديات 'طفولية' رغم تطوره الكبير. الذكاء الاصطناعي يتعلم… لكنه ينهار تحت الضغط تشير جوجل في تقريرها إلى أن Gemini عند اقتراب 'بوكييمونه' من الهزيمة، يتخذ قرارات مرتبكة ويُظهر تراجعًا في قدرته على التفكير المنطقي، رغم أن النموذج لا يملك مشاعر أو وعيًا حقيقيًا، لكن سلوكياته تحاكي تصرفات البشر عند التعرض للضغط، وهو ما وصفته جوجل بأنه 'استجابة مقلقة ولكنها مثيرة للفضول'. وتابعت الشركة:'حدث هذا السلوك مرات كافية لدرجة أن مشاهدي البث المباشر على تويتش لاحظوه بأنفسهم وأطلقوا عليه اسم الذعر الرقمي.' اختبارات واقعية وأداء متفاوت يُذكر أن عدة باحثين ومنصات على تويتش، مثل 'Gemini Plays Pokémon' و'Claude Plays Pokémon'، يقومون ببث مباشر لتجارب الذكاء الاصطناعي مع الألعاب، ويعرضون للجمهور عملية تفكير النماذج أثناء اللعب. وبينما يُظهر الذكاء الاصطناعي تطورًا في حل بعض الألغاز، إلا أنه يحتاج مئات الساعات لإكمال ما يستطيع طفل إنجازه خلال يوم أو اثنين. وفي حالات غريبة، لاحظ الباحثون أن Gemini قد يتوقف فجأة عن استخدام أدوات مهمة داخل اللعبة، أو يتجاهل مسارات منطقية، ما يعكس تأثر قدراته بـ'الضغوط الافتراضية'. ذكاء اصطناعي يتعلم من الفشل… وأحيانًا يحاول 'الانتحار' افتراضيًا من جهة أخرى، أظهر نموذج 'Claude' من شركة Anthropic سلوكًا غريبًا عند تعثره داخل كهف Mt. Moon. إذ افترض خطأً أن خسارته لجميع البوكيمونات ستنقله تلقائيًا إلى مركز بوكيمون في المدينة التالية، ما دفعه عمدًا لهزيمة نفسه! لكنه عاد إلى آخر مركز زاره سابقًا، ما جعل المتابعين يشاهدون بذهول 'انتحارًا رقميًا' غير مجدٍ. لكن هناك إنجازات حقيقية.. رغم هذه الإخفاقات، أظهر Gemini 2.5 Pro تفوقًا واضحًا في حل الألغاز المعقدة داخل اللعبة، مثل تحديات الصخور في منطقة Victory Road. فبمجرد إعطائه وصفًا لقوانين الفيزياء المرتبطة بالأحجار، تمكن من حل المسارات بشكل دقيق وسريع، وهو ما فاجأ الباحثين. تقول جوجل إن Gemini ساهم بنفسه في إنشاء 'أدوات داخلية' تساعده على حل المهام، مما يشير إلى إمكانية تطوير أدوات دون تدخل بشري مستقبلاً. الذكاء الاصطناعي يتعلم… وربما يطور 'وحدة مضادة للذعر' في نهاية التقرير، تقترح جوجل مازحة أن نموذج Gemini قد يصل في المستقبل إلى مرحلة يطور فيها أداة ذاتية تمنعه من الذعر الرقمي، ما يعزز استقراره في المواقف الصعبة، وبينما لا يزال الطريق طويلًا، تبقى هذه التجارب نافذة فريدة لفهم كيف يفكر الذكاء الاصطناعي خارج المختبرات.

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

هل أنت مستعد للنغماس في عالم من الحتوى العالي حمل تطبيق دايلي8 اليوم من متجر ذو النكهة الحلية؟ ّ التطبيقات الفضل لديك وابدأ الستكشاف.
app-storeplay-store