logo
#

أحدث الأخبار مع #HaoAILab

لعبة "سوبر ماريو" تكشف نقاط ضعف الذكاء الاصطناعي
لعبة "سوبر ماريو" تكشف نقاط ضعف الذكاء الاصطناعي

أخبارنا

time٠٥-٠٣-٢٠٢٥

  • علوم
  • أخبارنا

لعبة "سوبر ماريو" تكشف نقاط ضعف الذكاء الاصطناعي

أثبتت دراسة جديدة أن الذكاء الاصطناعي لا يزال يواجه تحديات كبيرة في الألعاب الديناميكية، حيث كشفت تجربة أجراها مختبر Hao AI Lab بجامعة كاليفورنيا سان دييغو عن تفاوت واضح في أداء النماذج الذكية عند اللعب بـ Super Mario Bros.. ورغم تقدم الذكاء الاصطناعي في مجالات عديدة، فإن هذه التجربة أظهرت نقاط ضعفه في اتخاذ القرارات السريعة المطلوبة في البيئات التفاعلية. وتم تشغيل اللعبة باستخدام إطار عمل GamingAgent، الذي يمنح الذكاء الاصطناعي القدرة على التحكم في ماريو من خلال أوامر برمجية. وأظهرت النتائج تفوق نموذج Claude 3.7 من شركة Anthropic، يليه Claude 3.5، في حين واجه كل من Google Gemini 1.5 Pro و GPT-4o من OpenAI صعوبات في مجاراة التحدي، رغم تفوق هذه النماذج في اختبارات الذكاء التقليدية. ويعزو الباحثون ضعف أداء بعض النماذج إلى طبيعة تفكيرها المنطقي المتسلسل، حيث تحتاج وقتًا أطول لاتخاذ القرار، وهو عامل حاسم في الألعاب التفاعلية مثل Super Mario Bros.، حيث يمكن أن يؤدي التأخير ولو لثانية واحدة إلى الفشل في القفز أو الاصطدام بالعقبات. ورغم أن الألعاب لطالما استخدمت كمعيار لاختبار قدرات الذكاء الاصطناعي، إلا أن بعض الخبراء يشككون في دقة هذه التقييمات. فالألعاب، على عكس العالم الحقيقي، توفر بيئات محددة تحتوي على كميات هائلة من البيانات، مما قد لا يعكس التحديات الفعلية التي يواجهها الذكاء الاصطناعي في مواقف أكثر تعقيدًا. وبينما تظل قدرة الذكاء الاصطناعي على التكيف مع التحديات التفاعلية محل نقاش، فإن هذه التجارب تقدم رؤية واضحة حول مدى تطوره في مجالات مختلفة، وربما في المستقبل، قد نرى أنظمة ذكاء اصطناعي قادرة على التفوق في الألعاب بنفس كفاءة أدائها في المهام الأخرى.

Super Mario Bros.. تكشف نقاط ضعف الذكاء الاصطناعى
Super Mario Bros.. تكشف نقاط ضعف الذكاء الاصطناعى

اليوم السابع

time٠٤-٠٣-٢٠٢٥

  • علوم
  • اليوم السابع

Super Mario Bros.. تكشف نقاط ضعف الذكاء الاصطناعى

لطالما استخدمت الألعاب لاختبار قدرات الذكاء الاصطناعي ، ولكن يبدو أن Super Mario Bros. أصبح الآن معيارًا جديدًا أكثر تعقيدًا من Pokémon! في دراسة حديثة أجراها مختبر Hao AI Lab بجامعة كاليفورنيا سان دييغو، تم وضع نماذج الذكاء الاصطناعي الرائدة في مواجهة مباشرة مع لعبة Super Mario Bros.، وكانت النتائج مفاجئة. نتائج الاختبار: Claude يتفوق وGPT-4o يعاني تم تشغيل اللعبة في محاكي خاص مدمج مع إطار عمل GamingAgent، والذي منح الذكاء الاصطناعي القدرة على التحكم بشخصية ماريو عبر أوامر برمجية. تم تزويد النماذج بتعليمات أساسية مثل 'إذا كان هناك عقبة أو عدو قريب، اقفز أو تحرك لليسار لتفاديه'، إلى جانب لقطات من اللعبة لمساعدتها في اتخاذ القرارات. أفضل أداء جاء من نموذج Claude 3.7 من Anthropic، يليه Claude 3.5، بينما عانى كل من Google Gemini 1.5 Pro و OpenAI GPT-4o في مجاراة التحدي. المفاجأة كانت أن النماذج التي تعتمد على التفكير المنطقي المتسلسل (reasoning models) مثل GPT-4o كان أداؤها أسوأ من النماذج الأخرى، رغم تفوقها في اختبارات الذكاء الاصطناعي التقليدية. لماذا يواجه الذكاء الاصطناعي صعوبة في الألعاب؟ وفقًا للباحثين، فإن السبب الرئيسي وراء ضعف أداء نماذج 'التفكير المنطقي' هو أنها تستغرق وقتًا طويلاً في اتخاذ القرار. في الألعاب مثل Super Mario Bros.، الوقت هو كل شيء—تأخير لثانية واحدة قد يكون الفرق بين القفز بنجاح أو السقوط في الهاوية! هل الألعاب معيار حقيقي لتقييم الذكاء الاصطناعي؟ لطالما استخدمت الألعاب لاختبار الذكاء الاصطناعي، ولكن هناك تساؤلات حول مدى دقة هذه الاختبارات. فالألعاب بيئات محدودة ومجردة مقارنة بالعالم الحقيقي، وتوفر كميات هائلة من البيانات للتدريب، مما قد لا يعكس التحديات الحقيقية التي يواجهها الذكاء الاصطناعي في المواقف الواقعية. حتى أندريه كارباتي، الباحث في OpenAI، وصف هذه الاختبارات بأنها 'أزمة تقييم'، قائلًا في منشور على منصة X:'لا أعرف حقًا ما هي المقاييس التي يجب التركيز عليها حاليًا… لا أعرف مدى قوة هذه النماذج فعلًا!'لكن على الأقل، يمكننا الآن مشاهدة الذكاء الاصطناعي يلعب Mario!

الرئيس الأميركي يوقف جميع المساعدات العسكرية لكييف.. ما هي انعكاسات القرار؟
الرئيس الأميركي يوقف جميع المساعدات العسكرية لكييف.. ما هي انعكاسات القرار؟

العربية

time٠٤-٠٣-٢٠٢٥

  • علوم
  • العربية

الرئيس الأميركي يوقف جميع المساعدات العسكرية لكييف.. ما هي انعكاسات القرار؟

في خطوة لافتة، باتت لعبة "سوبر ماريو بروس" أداةً جديدةً لقياس مدى تطور الذكاء الاصطناعي، حيث كشفت تجارب أجرتها منظمة Hao AI Lab عن نتائج مثيرة حول قدرة نماذج الذكاء الاصطناعي على التفاعل مع التحديات داخل اللعبة. وأظهرت التجارب تفوق نموذج Claude 3.7 من "أنثروبيك" في اجتياز اختبارات اللعبة، متقدماً على Claude 3.5، في حين عانى كل من Gemini 1.5 Pro من "غوغل" وGPT-4o من "OpenAI" في مواجهة العقبات. لم تكن التجربة قائمة على نسخة "سوبر ماريو بروس" الأصلية لعام 1985، بل تم تشغيل اللعبة عبر محاكي متكامل مع إطار عمل GamingAgent، والذي مكّن الذكاء الاصطناعي من التحكم بشخصية "ماريو" من خلال أوامر برمجية تعتمد على تحليل المواقف واتخاذ القرارات، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business". ورغم أن البرنامج زود الذكاء الاصطناعي بتعليمات أساسية، مثل القفز أو المراوغة عند مواجهة العقبات، إلا أن التجربة كشفت عن فروق جوهرية بين النماذج المختلفة. اللافت أن نماذج الاستدلال المنطقي، التي يُفترض أنها أكثر تقدماً في التفكير خطوة بخطوة، واجهت صعوبات أكبر مقارنة بالنماذج غير الاستدلالية، ما يطرح تساؤلات حول مدى فعالية هذه التقنيات في البيئات الديناميكية مثل الألعاب. هل يمكن الاعتماد على الألعاب كمعيار للذكاء الاصطناعي؟ لطالما استخدمت الألعاب كوسيلة لاختبار تطور الذكاء الاصطناعي، لكن بعض الخبراء يشككون في مدى دقة هذه المعايير، إذ يرى أندريه كارباثي، الباحث وعضو مؤسس في "OpenAI"، أن الألعاب قد لا تعكس بالضرورة القدرة الفعلية لهذه النماذج في التعامل مع العالم الحقيقي. وكتب في منشور على منصة إكس: "لا أعرف حقاً ما هي المقاييس التي يجب أن نعتمدها الآن. بصراحة، لا يمكنني تحديد مدى تطور هذه النماذج بالفعل."

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store