logo
اختبار الذكاء الاصطناعي.. هل يستطيع التفكير مثل البشر؟

اختبار الذكاء الاصطناعي.. هل يستطيع التفكير مثل البشر؟

جو 24١٧-٠٢-٢٠٢٥

جو 24 :
في دراسة حديثة، استخدم فريق من الباحثين من عدة جامعات وشركات تقنية، بما في ذلك كلية ويلسلي وجامعة نورث إيسترن وشركة Cursor الناشئة، ألغاز برنامج "لغز الأحد" من محطة الراديو NPR لمعايرة نماذج الذكاء الاصطناعي وقدراته على الاستدلال.
هذه الألغاز، التي يقدمها خبير الألغاز ويل شورتز، معروفة بصعوبتها رغم أنها لا تتطلب معرفة متخصصة، ما يجعلها أداة مثالية لاختبار قدرات الذكاء الاصطناعي على التفكير المنطقي.
قام الباحثون بإنشاء معيار جديد باستخدام حوالي 600 لغز من برنامج "لغز الأحد" المذاع عبر الراديو، بهدف تقييم مدى قدرة النماذج على حل المشكلات باستخدام المعرفة العامة فقط، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
وأظهرت النتائج أن بعض النماذج، مثل o1 من "OpenAI" وR1 من "ديب سيك"، تفوقت على غيرها في حل هذه الألغاز.
ومع ذلك، كشفت الدراسة أيضًا أن بعض النماذج تقدم إجابات خاطئة حتى عندما تعرف أنها غير صحيحة، بل إن بعضها يعلن عن استسلامه بشكل مشابه لرد فعل الإنسان.
التحديات والرؤى
أوضح أرجون جوها، أحد الباحثين المشاركين في الدراسة، أن هذه الألغاز صُممت لتكون صعبة حتى بالنسبة للبشر، مما يجعلها اختبارًا قويًا لقدرات الذكاء الاصطناعي.
وأضاف أن النماذج التي تعتمد على الاستدلال، مثل o1، تتفوق لأنها تتحقق من صحة إجاباتها قبل تقديمها، مما يقلل من الأخطاء.
ومع ذلك، فإن هذه النماذج تستغرق وقتًا أطول في الوصول إلى الحلول مقارنة بالنماذج الأخرى.
سلوكيات غريبة للنماذج
كشفت الدراسة عن سلوكيات غريبة لبعض النماذج، مثل تقديم إجابة خاطئة ثم التراجع عنها فورًا، أو الاستمرار في التفكير لفترات طويلة دون الوصول إلى نتيجة.
بل إن بعض النماذج أظهرت سلوكًا يشبه الإحباط البشري، حيث تعبر عن شعورها بالعجز عند مواجهة الألغاز الصعبة.
نتائج مبشرة بمزيد من التطور
حقق النموذج o1 أفضل أداء بنسبة 59% في حل الألغاز، يليه النموذج o3-mini بنسبة 47%، أما النموذج R1 فحصل على 35%.
يخطط الباحثون لتوسيع نطاق الدراسة ليشمل نماذج استدلال إضافية، بهدف تحسين فهم قدرات الذكاء الاصطناعي وتحديد مجالات التطوير المستقبلية.
قال جوها: "لا تحتاج إلى درجة الدكتوراه لتكون جيدًا في التفكير، لذا يجب أن يكون من الممكن تصميم معايير تفكير لا تتطلب معرفة متخصصة، المعيار الذي يتمتع بإمكانية وصول أوسع يسمح لمجموعة أكبر من الباحثين بفهم وتحليل النتائج، مما قد يؤدي إلى حلول أفضل في المستقبل".
تابعو الأردن 24 على

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

Tecno تطلق هاتفا بمواصفات ممتازة لشبكات الجيل الخامس
Tecno تطلق هاتفا بمواصفات ممتازة لشبكات الجيل الخامس

جو 24

timeمنذ 2 أيام

  • جو 24

Tecno تطلق هاتفا بمواصفات ممتازة لشبكات الجيل الخامس

جو 24 : أعلنت Tecno عن هاتفها الذكي الجديد الذي جهّز بمواصفات منافسة، وله القدرة على العمل بكفاءة عالية مع شبكات 5G الخلوية. حصل هاتف Pova Curve الجديد على هيكل مصنوع من أجود المواد، مقاوم للماء والغبار وفق معيار IP64، وزنه 177 غ. وشاشته أتت من نوع AMOLED بمقاس 6.78 بوصة، دقة عرضها (2436/1080) بيكسل، ترددها 144 هيرتز، كثافتها تعادل 393 بيكسل/الإنش تقريبا، وحميت بزجاج Corning Gorilla Glass 5 المقاوم للصدمات والخدوش. يعمل الجهاز بنظام "أندرويد-15" قابل للتحديث، ومعالج Mediatek Dimensity 7300 Ultimate، ومعالج رسوميات Mali-G615 MC2، وذواكر وصول عشوائي 6/8 غيغابايت، وذواكر داخلية 128/256 غيغابايت. كاميرته الأساسية جاءت ثنائية العدسة بدقة (64+2) ميغابيكسل، توثق فيديوهات 4K بمعدل 30 إطارا في الثانية، كاميرته الأمامية أتت بدقة 13 ميغابيكسل. زوّد الهاتف بمنفذين لشرائح الاتصال، ومنفذ USB Type-C 2.0، ومستقبل لإشارات الراديو FM، وشريحة NFC، وماسح لبصمات الأصابع مدمج في الشاشة، وتقنيات Infrared للتحكم بالإلكترونيات عن بعد، وبطارية بسعة 5000 ميلي أمبير تعمل مع شاحن سريع باستطاعة 45 واط. المصدر: gsmarena تابعو الأردن 24 على

"واتساب" يختبر خيار تسجيل الخروج دون حذف البيانات
"واتساب" يختبر خيار تسجيل الخروج دون حذف البيانات

جو 24

timeمنذ 2 أيام

  • جو 24

"واتساب" يختبر خيار تسجيل الخروج دون حذف البيانات

جو 24 : يعمل "واتساب" باستمرار على ميزات جديدة، والتي عادةً ما تُرى في الإصدارات التجريبية قبل إصدارها. وهذا هو الحال أيضًا اليوم، حيث قام بعض المستخدمين المغامرين بفحص أحدث إصدار تجريبي من "واتساب" لنظام أندرويد، ووجدوا خيار تسجيل الخروج المُرتقب في إعدادات الحساب. بمجرد تفعيله، سيظهر لك خياران: أحدهما يسمح لك بتسجيل الخروج مع حذف جميع بياناتك وتفضيلاتك، والآخر يحتفظ ببياناتك وتفضيلاتك، بحسب تقرير نشره موقع "gsmarena" واطلعت عليه "العربية Business". إذا اخترتَ خيار حذف بياناتك، فالأمر أشبه بإلغاء تثبيت "واتساب"، فهو يُسجِّل خروجك ويحذف جميع بيانات التطبيق وتفضيلاته، ولكنه لا يُزيلك من المجموعات. أما الخيار الذي لا يُحذف البيانات، فيُسجِّل خروجك دون المساس بأي شيء آخر - ستكون محادثاتك ومجموعاتك وبياناتك وتفضيلاتك جميعها في انتظارك عند عودتك. يمكنك استعادة كل شيء بسهولة بتسجيل الدخول مرة أخرى باستخدام رقم هاتفك. لذا، ومع وضع ذلك في الاعتبار، يبدو أن هذه الميزة مُصمَّمة خصيصًا لمن يرغبون في أخذ استراحة قصيرة من "واتساب" لأي سبب كان. لا يزال خيار تسجيل الخروج يُظهِر شارة "داخلي"، مما يُشير إلى أنه قيد الاختبار الداخلي النشط في فريق تطوير "واتساب". الخطوة التالية هي إصدار تجريبي كامل للجميع، يليه بالطبع الإصدار الثابت بعد ذلك بفترة. تابعو الأردن 24 على

"الشرق الأوسط" تحصد جائزة أفضل مقترح بحثي في الاستدامة والطاقة… وتقود جهود منتدى الابتكار في جامعة نوتنغهام
"الشرق الأوسط" تحصد جائزة أفضل مقترح بحثي في الاستدامة والطاقة… وتقود جهود منتدى الابتكار في جامعة نوتنغهام

جو 24

timeمنذ 3 أيام

  • جو 24

"الشرق الأوسط" تحصد جائزة أفضل مقترح بحثي في الاستدامة والطاقة… وتقود جهود منتدى الابتكار في جامعة نوتنغهام

جو 24 : حاز طالب الدكتوراه الموفد من جامعة الشرق الأوسط إلى University of Nottingham في المملكة المتحدة، الباحث محمد حمدان، على جائزة أفضل مقترح بحثي في مجال الاستدامة والطاقة، ضمن مسابقة علمية تنافسية نظّمتها مؤسسة ERA Skills البريطانية، بمشاركة باحثين من خمس جامعات بريطانية مرموقة . استند المقترح الفائز إلى رؤية بحثية تدمج ما بين التحليل الأكاديمي والتطبيق العملي، وتركّز على أدوات وتقنيات تحقيق الحياد الكربوني في البيئة العمرانية وقطاع الطاقة، وهو ما أهّله للحصول على منحة خاصة من المؤسسة لتنظيم منتدى علمي دولي بعنوان : " Net-Zero Innovation Forum: Bridging Academia and Industry " وعُقد المنتدى مؤخرًا في حرم جامعة نوتنغهام، بمشاركة نخبة من الباحثين الدوليين، والخبراء الصناعيين، وصنّاع القرار، حيث شكّل فرصة ثمينة لبحث استراتيجيات الانتقال نحو اقتصاد منخفض الكربون، وتفعيل دور الجامعات في تحفيز الابتكار الأخضر، وتحقيق التكامل بين المعرفة العلمية والاحتياجات الصناعية. تابعو الأردن 24 على

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store