أحدث الأخبار مع #تورينج،


النبأ
١٠-٠٤-٢٠٢٥
- علوم
- النبأ
الذكاء الاصطناعي يجتاز اختبار تورينج بشكل أفضل من الإنسان
وفقًا لدراسة جديدة، اجتاز روبوت دردشة رائد يعمل بتقنية الذكاء الاصطناعي اختبار تورينج بشكل أكثر إقناعًا من الإنسان. وأظهرت نتائج اختبار تورنج أن نموذج OpenAI GPT-4.5، الذي يُشغّل أحدث إصدار من ChatGPT، الذي يعد نموذج بشري "أكثر بكثير من البشر الحقيقيين". ويُعدّ اختبار تورينج، الذي اقترحه عالم الكمبيوتر البريطاني آلان تورينج لأول مرة عام 1950، مقياسًا لمدى قدرة الذكاء الاصطناعي على مضاهاة الذكاء البشري، حيث يتضمن الاختبار محادثة نصية مع مُستجوب بشري، والذي عليه تقييم ما إذا كان التفاعل مع إنسان آخر أم آلة. وشارك ما يقرب من 300 مشارك في أحدث دراسة، والتي أجرت اختبارات على روبوتات دردشة مختلفة ونماذج لغوية كبيرة (LLMs)، حيث تم تصنيف برنامج OpenAI GPT-4.5 على أنه إنسان بنسبة 73% عند تكليفه بتبني شخصية. تعليقات على الدراسة كتب الدكتور كاميرون جونز، باحث ما بعد الدكتوراه من جامعة كاليفورنيا في سان دييغو، والذي قاد الدراسة، في منشور على X: "نعتقد أن هذا دليل قوي على أن [روبوتات الدردشة التي تعمل بتقنية الذكاء الاصطناعي] تجتاز اختبار تورينج، بل إن 4.5 تم تصنيفه على أنه إنسان بنسبة أكبر بكثير من البشر الفعليين". وهذه ليست المرة الأولى التي يتفوق فيها برنامج ذكاء اصطناعي على اختبار تورينج، على الرغم من أن الباحثين من جامعة كاليفورنيا في سان دييغو الذين أجروا الدراسة يزعمون أن هذا هو الدليل الأكثر شمولًا على اجتياز المعيار. وشملت النماذج الأخرى التي تم اختبارها في أحدث الأبحاث برنامج Meta's Llama-3.1، والذي اجتاز الاختبار بشكل أقل إقناعًا. وعلى الرغم من اجتياز اختبار تورينج، أشار الباحثون إلى أن هذا لا يعني أن روبوتات الذكاء الاصطناعي تتمتع بذكاء بمستوى ذكاء الإنسان، المعروف أيضًا باسم الذكاء الاصطناعي العام (AGI)، ويعود ذلك إلى أن طلاب ماجستير القانون مُدرَّبون على مجموعات بيانات ضخمة للتنبؤ بالإجابة الصحيحة، مما يجعلهم في الأساس شكلًا متقدمًا من أشكال التعرف على الأنماط. والأهم من ذلك، أعتقد أن النتائج تُقدِّم دليلًا إضافيًا على أن طلاب ماجستير القانون يُمكنهم استبدال الأشخاص في التفاعلات القصيرة دون أن يُدرك أحد ذلك، وقد يؤدي هذا إلى أتمتة الوظائف، وتحسين هجمات الهندسة الاجتماعية، واضطراب مجتمعي أوسع نطاقًا.


البيان
٠٥-٠٤-٢٠٢٥
- علوم
- البيان
لحظة مفصلية في تاريخ الذكاء الاصطناعي.. GPT-4.5 يتفوّق على البشر في اختبار تورينج
توصلت دراسة جديدة إلى أن نموذج الذكاء الاصطناعي GPT-4.5، الذي طورته OpenAI، لم يكتفِ باجتياز اختبار تورينج فحسب، بل تفوّق أيضًا على البشر في إقناع المشاركين بإنسانيته. هذا الاكتشاف، الذي نُشر في ورقة بحثية أولية بانتظار مراجعة الأقران، يمثل تحولًا جذريًا في العلاقة بين الإنسان والآلة، ويثير تساؤلات جوهرية حول مستقبل الذكاء الاصطناعي ومكانته في المجتمع. اختبار تورينج، الذي صممه عالم الحوسبة البريطاني آلان تورينج عام 1949، يُعد معيارًا كلاسيكيًا لقياس مدى "تشابه" الآلة بالإنسان. ويعتمد الاختبار على قدرة الذكاء الاصطناعي في إجراء محادثة مع شخص دون أن يتمكن المتلقي من تحديد ما إذا كان يتحدث مع آلة أم إنسان. في هذه الدراسة، أجرى باحثون من جامعة كاليفورنيا نسخة محدثة من اختبار تورينج، حيث تفاعل المشاركون مع كلٍّ من إنسان حقيقي ونموذج ذكاء اصطناعي، ثم طُلب منهم تحديد من هو الإنسان. وعندما مُنح GPT-4.5 شخصية محددة ليتقمصها – مثل "شاب مثقف وواعٍ ثقافيًا" – اعتقد المشاركون أنه إنسان في 73% من الحالات. وهي نتيجة تفوق بكثير النسبة العشوائية المتوقعة التي تبلغ 50%. لكن اللافت أكثر هو أن أداء النموذج تراجع إلى 36% فقط عندما لم يُمنح أي "شخصية" يتقمصها، ما يبرز أهمية السياق والتمثيل السردي في تقنيات الذكاء الاصطناعي الحديثة. في المقابل، سجل النموذج GPT-4o من OpenAI نسبة 21% فقط، في حين حصل الروبوت ELIZA، الذي يعود إلى ستينيات القرن الماضي، على 23%، وفقا لمجلة " نيوزويك". وعلق كارستن يونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسات العامة، على النتائج بقوله: "لقد وصل الذكاء الاصطناعي إلى مستوى لم يعد الناس قادرين فيه على تمييزه عن البشر في المحادثات النصية. بل تُظهر هذه الدراسة أن الآلة قد تبدو أكثر إنسانية من الإنسان نفسه". وأضاف: "لقد تجاوزنا 'الوادي الغريب' الذي كانت فيه الروبوتات تُشبه البشر بشكل غير مريح، ودخلنا مرحلة جديدة تمامًا. الذكاء الاصطناعي بات يُستخدم اليوم في العلاج، والدعم النفسي، وحتى الرفقة، وقد يغير جذريًا طريقة تواصلنا عبر الإنترنت". وتابع يونغ أن السياسات الحكومية لا تزال متأخرة عن هذا التطور المتسارع، مؤكدًا على الحاجة إلى تحديثات تشريعية وتنظيمية تواكب قدرات الذكاء الاصطناعي الحديثة. وفي تعليق منفصل، كتب الباحث كاميرون جونز عبر منصة X: "تُظهر هذه النتائج أن أنظمة الذكاء الاصطناعي قد تتمكن من أداء مهام بشرية – مثل تقديم الاستشارات القانونية أو التفاعل الاجتماعي – دون أن يدرك الآخرون أنهم لا يتحدثون مع شخص حقيقي". وحذر جونز من أن هذا التقدم قد يؤدي إلى تغيّرات جذرية في سوق العمل، وزيادة خطورة هجمات الهندسة الاجتماعية، وحتى اضطرابات اجتماعية واسعة. ما هو اختبار تورينج؟ اختبار تورينج هو تجربة فكرية اقترحها عالم الرياضيات والحوسبة البريطاني آلان تورينج عام 1950 في ورقته الشهيرة "Computing Machinery and Intelligence". هدف الاختبار: معرفة ما إذا كانت الآلة قادرة على إظهار سلوك ذكي لا يمكن تمييزه عن سلوك الإنسان. كيف يعمل؟ يتم وضع إنسان (الحكم) في محادثة نصية مع طرفين مخفيين: أحدهما إنسان والآخر آلة (ذكاء اصطناعي). إذا لم يتمكن (الحكم) من التمييز بدقة بين الآلة والإنسان بناءً على المحادثة، فإن الآلة تُعتبر "ذكية" حسب معايير الاختبار. ما الجديد في اختبار GPT-4.5؟ في الدراسة الحديثة، طُبِّقت نسخة معدّلة من اختبار تورينج التقليدي، أكثر واقعية ودقة، وجاءت بتغييرات أساسية: 1. مشاركة نماذج متعددة: تمت مقارنة GPT-4.5 بنماذج مختلفة: GPT-4o (أحدث إصدار مفتوح من OpenAI) LLaMA 3.1–405B (من Meta) ELIZA (أول روبوت محادثة من الستينيات) 2. إضافة "شخصية" للنموذج: عندما أُعطي GPT-4.5 شخصية مثل "شاب مثقف وواعٍ ثقافيًا"، زادت قدرته على الإقناع بدرجة كبيرة. النتيجة: تم التعرف عليه بالخطأ كإنسان في 73% من الحالات. 3. وضع بدون شخصية: عند إزالة الشخصية والتفاعل بشكل عام، تراجعت النتيجة إلى 36% فقط. 4. معيار المقارنة: المعدل المتوقع عشوائيًا هو 50%. أي نتيجة أعلى من 50% تعني أن الذكاء الاصطناعي أقنع البشر بإنسانيته أكثر من البشر أنفسهم. لماذا يعتبر ذلك إنجازًا؟ تاريخيًا: لم يكن أي نموذج سابق يتجاوز البشر في هذا الاختبار. نفسيًا واجتماعيًا: أصبح الناس يرون الذكاء الاصطناعي أكثر "إنسانية" من الإنسان، عند تقديمه بالشكل المناسب. تقنيًا: يُظهر أهمية تصميم السياق والشخصيات في أداء الذكاء الاصطناعي. أمنيًا: قد يؤدي إلى استخدام الذكاء الاصطناعي في الهندسة الاجتماعية أو التلاعب النفسي.