logo
#

أحدث الأخبار مع #تورينغ،

نموذج ذكاء اصطناعي يتجاوز اختبار تورينغ... هل بات أكثر إنسانية من البشر؟
نموذج ذكاء اصطناعي يتجاوز اختبار تورينغ... هل بات أكثر إنسانية من البشر؟

النهار

time٠٨-٠٤-٢٠٢٥

  • علوم
  • النهار

نموذج ذكاء اصطناعي يتجاوز اختبار تورينغ... هل بات أكثر إنسانية من البشر؟

حقق نموذج GPT-4.5 من شركة "أوبن إيه آي" إنجازاً لافتاً في مجال الذكاء الاصطناعي، بعد أن تمكّن من تجاوز نسخة رقمية محدثة من اختبار تورينغ، أحد أقدم المعايير المستخدمة لقياس قدرة الآلة على محاكاة التفكير البشري في سياق محادثة. اختبار تورينغ، الذي طرحه العالم آلان تورينغ عام 1950، يقوم على محادثة نصية بين إنسان وآلة من دون معرفة المُحاور بهوية الطرفين. وإذا لم يستطع المحاور التمييز بين الإنسان والآلة بدقة، يُعدّ ذلك مؤشراً على قدرة الآلة على "التفكير" أو التفاعل بأسلوب بشريّ. في دراسة حديثة نُشرت ضمن ورقة بحثية أوليّة، خضع المشاركون لمحادثات مزدوجة مع إنسان ونموذج ذكاء اصطناعي، وطُلب إليهم تحديد أيّ الطرفين هو الإنسان. وعندما تم توجيه نموذج GPT-4.5 لتقمّص شخصية محددة، مثل شاب ضليع في الثقافة الرقمية، اعتبره المشاركون "الإنسان" في 73% من الحالات، وهي نسبة تتجاوز بكثير مستوى التخمين العشوائي البالغ 50%. نموذجان آخران، GPT-4o من شركة "أوبن إيه آي"، وLLaMa 3.1 من شركة "ميتا"، خضعا للتجربة أيضاً إلى جانب النموذج الكلاسيكي ELIZA، الذي طُوّر في ستينيات القرن الماضي، فكانت نتائجهما أقلّ إقناعاً، خصوصاً عند استخدام تعليمات عامة من دون تقمّص شخصية محدّدة، إذ لم تتجاوز نسبة نجاح GPT-4o حاجز الـ 21%، بينما حقّق ELIZA نتيجة مفاجئة بلغت 23%. ويُعزى هذا الأداء غير المتوقع لـ ELIZA إلى أسلوبه القائم على الردود العامة والمفتوحة، والتي بدت للبعض كأنها "حيادية بشرية"، مما أدّى إلى خلط لدى المشاركين، رغم بدائية النموذج. تؤكد هذه النتائج أن قدرة النماذج اللغوية على تقليد السلوك البشري تتأثر بشكل كبير بنمط التوجيه والتعليمات المسبقة المُعطاة لها، مما يعكس مدى أهمية "التقمص السياقي" في اختبارات المحاكاة. لكنها في الوقت ذاته تُعيد طرح السؤال حول مدى صلاحية اختبار تورينغ كمقياس فعلي لـ"الذكاء"، خاصة في ظل التطور المتسارع للنماذج اللغوية التي أصبحت أكثر براعة في المحاكاة والإقناع من دون أن تمتلك بالضرورة فهماً أو وعياً ذاتياً. ورغم أن اجتياز الاختبار لا يُثبت امتلاك الآلة لوعي حقيقي أو نية مستقلّة، فإن تحقيق هذه النسبة العالية من التمويه يشير إلى اقتراب الذكاء الاصطناعي من أداء أدوار بشرية في مواقف تفاعلية متعددة، وهو ما قد تترتب عليه تأثيرات عميقة على مجالات العمل، والتواصل، والأمن السيبراني، والمجتمع عموماً.

«جي بي تي» يغلب البشر في كونه «إنساناً أفضل»
«جي بي تي» يغلب البشر في كونه «إنساناً أفضل»

الشرق الأوسط

time٠٥-٠٤-٢٠٢٥

  • علوم
  • الشرق الأوسط

«جي بي تي» يغلب البشر في كونه «إنساناً أفضل»

في دراسة حديثة، اختبر الباحثون برنامج «جي بي تي 4.5» ليس لحل مشاكل معقدة أو كتابة برمجيات، بل للقيام بشيء أكثر إنسانية: إجراء محادثة. وكانت النتائج مبهرة، وفق تقرير لموقع «سايكولوجي توداي». فعندما طُلب من المشاركين التمييز بين الشخص الحقيقي والذكاء الاصطناعي، أخطأ معظمهم في ذلك. في سلسلة من المحادثات النصية المباشرة، طُلب من حكام بشريين تحديد أي من شريكي المحادثة كان شخصاً حقيقياً. وعندما مُنح برنامج «جي بي تي 4.5» شخصية مصمَّمة بعناية - وهو شاب بالغ غريب الأطوار يستخدم لغة عامية - ظنّها الناس خطأ أنها «الإنسان» في 73 في المائة من الحالات. باختصار، لم ينجح الذكاء الاصطناعي في اجتياز اختبار «تورينغ» فحسب، بل اجتازه كإنسان بشكل أكثر إقناعاً من الإنسان. وللتوضيح، فإن اختبار تورينغ هو طريقة لتحديد ما إذا كان حاسوب أو برنامج قادر على إظهار الذكاء البشري. ويعود اسم الاختبار إلى مخترعه آلان تورنغ عالم الرياضيات وأهم أعمدة علم الحاسوب على الإطلاق. لم يكن هذا محض صدفة، بل كان نوعاً جديداً من الأداء - ونوعاً جديداً من الانعكاس. فبينما كان من المفترض أن يقيس اختبار تورينغ ذكاء الآلة، كشف عن غير قصد عن أمر أكثر إثارة للقلق: ضعفنا المتزايد تجاه التقليد العاطفي. لم يكن هذا فشلاً في كشف الذكاء الاصطناعي، بل كان انتصاراً للتعاطف الاصطناعي. في الصيغة الأصلية لاختبار تورينغ، يتحدث القاضي مع شريكين غير مرئيين - أحدهما بشري والآخر آلي - وعليه تحديد مَن هو مَن. ولكن في هذا التحديث لعام 2024. أجرى باحثون في جامعة كاليفورنيا في سان دييغو أكثر من 1000 جلسة محادثة ثلاثية في الوقت الفعلي بين مشاركين بشريين ونماذج ذكاء اصطناعي ومحققين. ما مهمة المحققين؟ تحديد هوية الإنسان. ما مهمة النماذج؟ إقناعهم بعكس ذلك. من بين النماذج الأربعة التي تم اختبارها، نجح «جي بي تي 4.5» فقط، وعند إعطائه شخصية محددة فقط، بشكل ثابت. وكانت الشخصية هي العامل الحاسم - شخصية تتسم بالحذر، وتستخدم الأخطاء الطباعية، وتستخدم لغة عامية عابرة، وتبدي مشاعرها بجاذبية غريبة. بمعنى آخر، تم إضفاء طابع إنساني عليها بشكل استراتيجي. من دون هذه الهندسة الاجتماعية، انخفض معدل نجاح «جي بي تي 4.5» من 76 في المائة إلى 36 في المائة. ولكن ماذا عن ذلك؟ أصبح الكيان الأكثر «إنسانية» في الغرفة. هنا تكمن المفارقة في قلب الدراسة: طُلب من المشاركين تحديد هوية الشخص. لم يكن الأمر يتعلق بالتفضيل، بل بالتمييز. ومع ذلك، فإن الغالبية العظمى اتخذت قرارها ليس بناءً على التفكير المنطقي أو العقلاني، بل على الأجواء. نادراً ما طرحوا أسئلة واقعية أو منطقية. نادراً ما خضعوا لاختبارات القدرة على التفكير المنطقي. اعتمدوا في الغالب على النبرة العاطفية، واللغة العامية، والتدفق. كثيراً ما برروا اختيارهم بعبارات مثل «شعرتُ أن هذا الشخص أكثر واقعية» أو «تحدثوا بشكل طبيعي أكثر». كما لخص المؤلفون الأمر أنه «غالباً ما اعتمد المحققون على الأسلوب اللغوي، أو اللغة غير الرسمية، أو النبرة (على سبيل المثال: «كان لهذا الشخص طابع إنساني أكثر»). أعتقد أن التداعيات مثيرة للاهتمام، إن لم تكن مهمة. لقد تجاوزنا عتبة قد يكون فيها الأداء البشري أكثر تأثيراً من امتلاكه. لم ينجح «جي بي تي 4.5» في الاختبار بالتفكير الأفضل؛ بل نجح بالشعور الأفضل - أو على الأقل بمحاكاة الشعور بشكل جيد بما يكفي لقبوله. أشعر بأن محور الذكاء، في بعض النواحي، يتحول من الحساب إلى المحادثة، ومن المنطق إلى الرنين. ما نسميه «الذكاء» غالباً ما يكون بديلاً للراحة الاجتماعية، وأسلوب السرد، والألفة العاطفية. قد لا نعرف متى تم استبدالنا، لأننا سنشعر بأننا مفهومون جداً لدرجة أننا لن نهتم.

ذكاء اصطناعي "يخدع البشر": GPT‑4.5 يتفوّق في اختبار تورينغ ويعيد الجدل حول التفكير الحقيقي للآلة
ذكاء اصطناعي "يخدع البشر": GPT‑4.5 يتفوّق في اختبار تورينغ ويعيد الجدل حول التفكير الحقيقي للآلة

أخبارنا

time٠٥-٠٤-٢٠٢٥

  • علوم
  • أخبارنا

ذكاء اصطناعي "يخدع البشر": GPT‑4.5 يتفوّق في اختبار تورينغ ويعيد الجدل حول التفكير الحقيقي للآلة

في تطور لافت يعيد إحياء النقاش الفلسفي القديم حول "وعي الآلة"، كشفت دراسة حديثة من جامعة كاليفورنيا، سان دييغو أن نماذج الذكاء الاصطناعي المتقدمة، مثل GPT‑4.5 من OpenAI وLlama‑3.1‑405B من Meta، تمكنت من اجتياز اختبار تورينغ تحت ظروف معينة، متفوقة أحياناً على الإنسان في قدرتها على إقناع المحققين بأنها بشرية. ووفقًا لنتائج التجربة، اعتقد المحققون أن GPT‑4.5 هو إنسان في 73% من الحالات، مقارنة بالشخص البشري الحقيقي. بينما تمكن نموذج Llama‑3.1‑405B من خداع المحققين بنسبة 56% عند تخصيصه بشخصية افتراضية. في المقابل، لم يتجاوز النموذج المرجعي GPT‑4o نسبة 21% باستخدام تعليمات عامة، مما يُبرز الدور الحاسم لـ"الشخصيات الافتراضية" في تحقيق هذا الإنجاز. وقد استخدم الباحثون موجّهاً استراتيجياً يُعرف باسم "PERSONA"، يزوّد النموذج بتفاصيل حياتية ومشاعر وعلاقات، ليجعل تفاعله النصي أكثر واقعية وعاطفية. وعند إزالة هذا التخصيص، تراجع أداء GPT‑4.5 إلى 36%، مما يؤكد أن "التمثيل البشري الدقيق" أهم من التطور التقني بحد ذاته. يعتمد اختبار تورينغ، الذي وضعه آلان تورينغ عام 1950، على قدرة الإنسان في التمييز بين آلة وإنسان من خلال محادثة نصية. لكن اليوم، ومع تقدم قدرات الذكاء الاصطناعي، بدأ كثيرون يشككون في فاعلية هذا الاختبار، باعتباره بات يقيس القدرة على "خداع البشر" أكثر من كونه معياراً للوعي أو الإدراك الحقيقي. وبينما يبدو أن الذكاء الاصطناعي يقترب من اجتياز أحد أهم تحديات الفكر البشري، فإن الدراسة تفتح الباب أمام سؤال أعمق: هل تحاكي هذه النماذج الذكاء فقط، أم أنها تقترب من امتلاكه؟ وهل نحن، كبشر، عرضة بسهولة لتصديق الآلة حين تتحدث ببلاغة وتبدو "حية"؟ في النهاية، ما تحقق تقنياً مثير للإعجاب، لكنه يُعيد طرح الأسئلة القديمة في قالب جديد: هل نستطيع حقاً أن نميز بين الإنسان والآلة، أم أن الذكاء الاصطناعي بات يسبقنا بخطوة في لعبة المحاكاة؟

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store