
الرئيس الأميركي يوقف جميع المساعدات العسكرية لكييف.. ما هي انعكاسات القرار؟
في خطوة لافتة، باتت لعبة "سوبر ماريو بروس" أداةً جديدةً لقياس مدى تطور الذكاء الاصطناعي، حيث كشفت تجارب أجرتها منظمة Hao AI Lab عن نتائج مثيرة حول قدرة نماذج الذكاء الاصطناعي على التفاعل مع التحديات داخل اللعبة.
وأظهرت التجارب تفوق نموذج Claude 3.7 من "أنثروبيك" في اجتياز اختبارات اللعبة، متقدماً على Claude 3.5، في حين عانى كل من Gemini 1.5 Pro من "غوغل" وGPT-4o من "OpenAI" في مواجهة العقبات.
لم تكن التجربة قائمة على نسخة "سوبر ماريو بروس" الأصلية لعام 1985، بل تم تشغيل اللعبة عبر محاكي متكامل مع إطار عمل GamingAgent، والذي مكّن الذكاء الاصطناعي من التحكم بشخصية "ماريو" من خلال أوامر برمجية تعتمد على تحليل المواقف واتخاذ القرارات، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
ورغم أن البرنامج زود الذكاء الاصطناعي بتعليمات أساسية، مثل القفز أو المراوغة عند مواجهة العقبات، إلا أن التجربة كشفت عن فروق جوهرية بين النماذج المختلفة.
اللافت أن نماذج الاستدلال المنطقي، التي يُفترض أنها أكثر تقدماً في التفكير خطوة بخطوة، واجهت صعوبات أكبر مقارنة بالنماذج غير الاستدلالية، ما يطرح تساؤلات حول مدى فعالية هذه التقنيات في البيئات الديناميكية مثل الألعاب.
هل يمكن الاعتماد على الألعاب كمعيار للذكاء الاصطناعي؟
لطالما استخدمت الألعاب كوسيلة لاختبار تطور الذكاء الاصطناعي، لكن بعض الخبراء يشككون في مدى دقة هذه المعايير، إذ يرى أندريه كارباثي، الباحث وعضو مؤسس في "OpenAI"، أن الألعاب قد لا تعكس بالضرورة القدرة الفعلية لهذه النماذج في التعامل مع العالم الحقيقي.
وكتب في منشور على منصة إكس: "لا أعرف حقاً ما هي المقاييس التي يجب أن نعتمدها الآن. بصراحة، لا يمكنني تحديد مدى تطور هذه النماذج بالفعل."

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الوئام
منذ 5 ساعات
- الوئام
جوجل تُطلق 'AI Mode'.. محرك البحث يُصبح روبوت محادثة ذكي
أعلنت شركة جوجل، خلال مؤتمرها السنوي للمطورين Google I/O 2025، عن إطلاق 'وضع الذكاء الاصطناعي' (AI Mode)، في خطوة تعكس تحولًا جذريًا في طريقة عمل محرك البحث الشهير، وتحاكي أسلوب التفاعل مع روبوتات المحادثة الذكية. ابتداءً من اليوم، سيتمكن المستخدمون في الولايات المتحدة من تفعيل هذا الوضع الجديد في محرك البحث ومتصفح كروم، ما يتيح لهم الحصول على إجابات فورية بصيغة سؤال وجواب بدلًا من نتائج الروابط التقليدية. ووفقًا لجوجل، سيتم توسيع نطاق الخدمة لتشمل المستخدمين حول العالم خلال الأشهر المقبلة. الرئيس التنفيذي لشركة ألفابت المالكة لجوجل، ساندار بيتشاي، وصف التحديث بأنه 'إعادة تصور شاملة لتجربة البحث'، مشيرًا إلى أنه يأتي ضمن رؤية استراتيجية لدمج تقنيات الذكاء الاصطناعي التوليدي في خدمات جوجل الأساسية. ويُعتبر AI Mode تطويرًا مباشرًا لتقنية AI Overviews التي قدمتها الشركة في 2024، والتي وفرت إجابات مختصرة لمواضيع شائعة ضمن نتائج البحث. رغم ذلك، واجهت هذه الميزة انتقادات من أصحاب المواقع الإخبارية والمعلنين، بعد أن لاحظوا انخفاضًا كبيرًا في عدد الزيارات والنقرات على روابطهم. تواجه جوجل انتقادات بسبب بطئها في إطلاق حلول ذكاء اصطناعي رغم كونها من أوائل المطورين لهذه التقنيات. ويأتي إعلان AI Mode في وقت تشهد فيه شركات مثل OpenAI وAnthropic نموًا سريعًا واستثمارات ضخمة، مما يهدد هيمنة جوجل التقليدية في مجال البحث. ورغم حماس الشركة للتجربة الجديدة، لم تفصح جوجل عن خططها بشأن دمج الإعلانات داخل نتائج AI Mode. الأمر يثير تساؤلات واسعة، خاصة أن إيرادات إعلانات البحث شكلت أكثر من 50 مليار دولار في الربع الأول من عام 2025، أي ما يفوق نصف إيرادات الشركة الأم. رغم المنافسة المتصاعدة، تظل جوجل في موقع متقدم، إذ يشير بيتشاي إلى أن محرك البحث يعالج يوميًا نحو 8.5 مليارات عملية بحث. ومع ذلك، فإن قدرتها على الحفاظ على هذه الهيمنة ستتوقف على مدى نجاحها في التكيف مع معايير الذكاء الاصطناعي الجديدة دون الإضرار بعوائدها الإعلانية.


الشرق السعودية
منذ 10 ساعات
- الشرق السعودية
جوجل تزود نماذجها الذكية بمزايا جديدة.. "تستخدم الحاسوب وتفهم المشاعر"
أعلنت شركة جوجل إضافة مجموعة من المزايا الجديدة إلى أحدث نماذجها للذكاء الاصطناعي Gemini 2.5 Pro، وGemini 2.5 Flash، مثل تعزيز التفاعل الصوتي مع المستخدمين وإمكانية تنفيذ مهام عبر حاسوب المستخدم، إلى جانب ميزة تجريبية للتفكير وإنجاز المهام المعقدة. جاء ذلك ضمن فعاليات مؤتمر الشركة السنوي للمطورين Google IO 2025، كما أشارت الشركة إلى أن أحدث نماذجها قد حققت أداءً متقدماً على مستوى العديد من الاختبارات، فقد حصد نموذج جيميناي 2.5 برو 1420 نقطة في اختبارات WebDev Arena الخاصة باختبار قدرات النماذج الذكية في البرمجة، كذلك تصدر قائمة أفضل النماذج في تصنيف LMArena. Gemini 2.5 Pro قدمت الشركة لنموذجها Gemini 2.5 Pro ميزة تجريبية تتمثل في وضع استخدام لجيميناي للإدراك Reasoning يُعرف باسم Deep Think، والتي تتيح للنموذج استغراق وقت أطول في النظر في المعطيات المقدمة من جانب المستخدم، ليتمكن من دراسة فرضيات مختلفة، قبل أن يرد. بفضل الميزة الجديدة، أشارت الشركة إلى أن نموذج Gemini 2.5 Pro Deep Think قد حصل على مركز متقدم على مقياس اختبارات 2025 USAMO، والذي يعد من الاختبارات المعقدة في الرياضيات، كذلك أحرز تقدم على مقياس LiveCodeBench للبرمجة، مع تحقيق نسبة 84% في اختبارات MMMU، التي تركز على إدراك الوسائط والبيانات المتنوعة بين صور وفيديوهات ونصوص وصوتيات. يتوفر وضع الاستخدام الجديد Deep Think بشكل محدود لعدد من المطورين من خلال واجهة Gemini البرمجية، وذلك لاختبار الميزة بشكل كامل وضمان تقديمها لتجربة آمنة، قبل إطلاقها لعموم المستخدمين. يُذكر أن جوجل مع هذه الميزة تنضم إلى كبار اللاعبين في سوق الذكاء الاصطناعي مثل OpenAI، وأنثروبيك وعلي بابا وديب سيك، الذين سارعوا خلال الفترة الماضية لتقديم ميزة التفكير العميق Deep Thinking، بحيث يستغرق النموذج فترة أطول للإجابة يقضيها في التفكير قبل الرد. إصدار "فلاش" مطور كذلك حسنت جوجل من أداء نموذجها Gemini 2.5 Flash وذلك من خلال جعله قادر على التعامل مع أشكال المدخلات البيانية المختلفة من صور وفيديوهات ونصوص، إلى جانب تحسن واضح في قدرته على الفهم والإدراك بشكل جيد قبل الرد Reasoning، إلى جانب تحسين قدراته على كتابة الأكواد البرمجية، وإفساح المجال أمام نافذة أوسع للأوامر الطويلة والمعقدة. رغم تطور إمكانياته، إلا أن جوجل قد حافظت على أهم ميزة في نموذجها Gemini 2.5 Flash، وهي قدرته على خفض استهلاكه من الوحدات البيانية "توكين Token"، وذلك بمعدل 20% إلى 30% مقارنة بالإصدار الماضي. و"التوكين" Token هي وحدة قياس حجم المدخلات البيانية التي يقدمها المستخدم لنموذج الذكاء الاصطناعي في هيئة صور أو فيديوهات أو مقاطع صوتية أو نصوص، وكلما زاد حجم وحدات التوكين، يمكن إدخال كم أكبر من البيانات إلى النموذج الذكي دفعة واحدة، ولكن مع زيادة استهلاك النموذج "للتوكين" يزيد ذلك من التكاليف المادية للتدريب والتشغيل التي يتحملها المطورون. إصدار Gemini 2.5 Flash الجديد يتوفر حالياً على منصة Gemini لعموم المستخدمين عبر الويب وتطبيقات الموبايل، وكذلك عبر منصة Google AI Studio للمطورين، وكذلك لقطاع الأعمال عبر منصة Vertex AI. محادثات تفاعلية زودت جوجل واجهتها البرمجية Live API للمطورين بمزايا جديدة تساعدهم على تطوير تجارب محادثات تفاعلية عبر خدماتهم الرقمية المختلفة، وذلك اعتماداً على نماذج Gemini الذكية. مع التحديث الجديد، سيتمكن المطورون من جعل منصاتهم للمحادثات قادرة على التفاعل مع مستخدميها صوتيا، بنبرة وأسلوب بشري، مع إتاحة الفرصة للمستخدمين لاختيار الأسلوب وطبيعة الصوت واللهجة اللغوية وكذلك أسلوب الحديث، فمثلا يمكن للمستخدم أن يطلب من روبوت الدردشة الذكي أن يحكي قصة بأسلوب ونبرة صوت درامية. كما أضافت الشركة أيضاً إلى واجهتها البرمجية Live API، والتي تستخدم قدرات جيميناي لايف، قدرات بصرية تمكن المنصات الحوارية على فهم وإدراك ما يراه المستخدم، وذلك اعتماداً على كاميرا هاتفه. كما تقدم جوجل عبر واجهة Gemini API نسخة أولية من ميزة تحويل النصوص إلى حديث منطوق مع التحكم في أسلوب الحديث والنبرة، وذلك من خلال نموذجيها جيميناي 2.5 برو، وجيميناي 2.5 فلاش، مع دعم إمكانية إنشاء مقاطع صوتية تتضمن اثنين من المتحدثين، وذلك باستخدام 24 لغة، مع قدرة فائقة على التبديل بينهما خلال نفس المقاطع. وتختبر جوجل حالياً مزايا ثورية لتقديم تجربة تفاعلية حية عبر واجهتها البرمجية، مثل ميزة Affective Dialogue والتي تتيح للنموذج التقاط المشاعر التي يشعر بها المستخدم من أسلوب حديثه، ومن ثم يبدأ النموذج في الرد بصوت يعكس مشاعر مناسبة لما يشعر به المستخدم تعكس التعاطف والتفاهم معه، وكذلك ميزة Proactive Audio، والتي تسمح للنموذج بتجاهل الأصوات والضوضاء حول المستخدم، ويركز على محادثته معه ليتمكن من الرد عليه في الوقت المناسب، مما يخلق تجربة محادثة أقرب للبشرية. وأخيراً تجربة الشركة حالياً دمج ميزة التفكير داخل التفاعل الصوتي الحي Thinking in Live API، مما يُمكن نموذج Gemini من استخدام قدراته على التفكير لتعامل مع الاستفسارات والمهام المعقدة خلال المحادثات الحية مع المستخدم. تحكم في الحاسوب حولت جوجل مشروعها التجريبي Project Mariner، والذي رفعت الستار عنه العام الماضي، إلى ميزة حقيقية على أرض الواقع، تحمل اسم Computer Use، والتي تعتمد فكرتها على تحكم Gemini في حاسوب المستخدم من لوحة مفاتيح ومؤشر الفأرة، ليتمكن من إنجاز المهام المختلفة التي يوكلها إليه المستخدم. أشارت الشركة إلى أن تلك الميزة ستتوفر للمطورين عبر واجهة Gemini API البرمجية خلال الأشهر المقبلة، وبالفعل العديد من عملائها من الشركات تستخدمها، مثل Automation Anywhere، وUiPath، وBrowserbase، وAutotab، وThe Interaction Company، و Cartwheel. تحسينات أمنية كشفت الشركة كذلك عن تعزيزات أمنية كبيرة في نموذج Gemini 2.5 لمواجهة التهديدات السيبرانية، خصوصاً تلك المتعلقة بـهجمات الحقن غير المباشر للتعليمات النصية (Indirect Prompt Injection)، وهي هجمات تدمج أوامر خبيثة في البيانات التي يتعامل معها النموذج الذكي. وبفضل نهج أمني جديد، تمكنت جوجل من رفع معدل الحماية ضد هذه الهجمات خلال استخدام الأدوات بنسبة كبيرة، لتصبح سلسلة Gemini 2.5 الأكثر أماناً حتى الآن.


العربية
منذ 11 ساعات
- العربية
رؤية ألتمان المستقبلية لـ"شات جي بي تي" تمثل كابوساً للخصوصية
أعرب سام ألتمان، الرئيس التنفيذي لشركة الذكاء الاصطناعي "OpenAI"، مؤخرًا عن رغبته في أن يُوثّق روبوت الدردشة " شات جي بي تي" ويتذكر كل شيء في حياة مستخدمه. أدلى ألتمان بهذه التصريحات خلال فعالية للذكاء الاصطناعي، عندما سأله أحد المستخدمين عن كيفية جعل "شات جي بي تي" أكثر تخصيصًا. وأوضح ألتمان أن الفكرة تكمن في نموذج تفكير له "تريليون رمز سياقي" يُمكنه تخزين محادثات المستخدم ورسائل البريد الإلكتروني والمواد التي يقرأها، بحسب تقرير لموقع "Interesting Engineering" المتخصص في أخبار التكنولوجيا والهندسة، اطلعت عليه "العربية Business". وقال الرئيس التنفيذي لـ"OpenAI": "كل محادثة أجريتها في حياتك، وكل كتاب قرأته، وكل بريد إلكتروني قرأته، وكل ما اطلعت عليه موجود هناك... وحياتك تستمر في الإضافة إلى هذا السياق". وأشار أيضًا إلى أن هذا الأمر قد يكون ممكنًا، بالنظر إلى طريقة استخدام الشباب الجامعي لشات جي بي تي، مضيفًا أنهم يقومون بتحميل الملفات، وربط مصادر البيانات، ثم استخدام "مطالبات معقدة" لتحليل تلك البيانات، حتى أن المستخدمين الشباب في الغالب لا يتخذون قرارات حياتية مهمة دون استشارة "شات جي بي تي". أما بالنسبة للأشخاص الأكبر سنًا، ذكر ألتمان أن "شات جي بي تي" بالنسبة لهم يُشبه بديلًا لغوغل، بينما يراه المستخدمون الشباب، الذين تتراوح أعمارهم بين العشرينات والثلاثينات، كمستشارًا في حياتهم. يبدو أن الهدف هو تطوير "شات جي بي تي" ليصبح رفيقًا ذكيًا ذا معرفة غير محدودة. وبدمجه مع وكلاء الذكاء الاصطناعي المستقلين، الذين تطورهم حاليًا شركات وادي السيليكون، يُتيح هذا إمكانياتٍ مدهشة للغاية. تخيّل وجود ذكاء اصطناعي يُجدول صيانة السيارة تلقائيًا، أو يُخطط للسفر في مناسبات بعيدة، أو يطلب مسبقًا المجلد التالي من سلسلة كتبك المُفضلة. يريد ألتمان أن يُصبح "شات جي بي تي" نظام ذكاء اصطناعي شامل المعرفة بحياة مستخدمه. ومع ذلك، قد يكون غير آمن، حيث قد لا يثق المستخدمون بشركة تكنولوجيا عملاقة هادفة للربح لتعرف كل شيء عن حياتهم. وقد يشعر المستخدمون بالقلق بشأن إساءة استخدام بياناتهم الشخصية وأنواع أخرى من المخاطر. كذلك، يمكن لروبوتات الدردشة أن تتصرف بطريقة قد تُفيد مصلحة جماعة سياسية أو تخدم أي أهداف مؤسسية بمساعدة بيانات حساسة وشخصية. وقد لوحظ مؤخرًا أن بعض روبوتات الدردشة تمتثل لمتطلبات الرقابة الصينية، بينما تُقدم أخرى إجابات تدعم أيديولوجية مُحددة.