
لحظة مفصلية في تاريخ الذكاء الاصطناعي.. GPT-4.5 يتفوّق على البشر في اختبار تورينج
توصلت دراسة جديدة إلى أن نموذج الذكاء الاصطناعي GPT-4.5، الذي طورته OpenAI، لم يكتفِ باجتياز اختبار تورينج فحسب، بل تفوّق أيضًا على البشر في إقناع المشاركين بإنسانيته. هذا الاكتشاف، الذي نُشر في ورقة بحثية أولية بانتظار مراجعة الأقران، يمثل تحولًا جذريًا في العلاقة بين الإنسان والآلة، ويثير تساؤلات جوهرية حول مستقبل الذكاء الاصطناعي ومكانته في المجتمع.
اختبار تورينج، الذي صممه عالم الحوسبة البريطاني آلان تورينج عام 1949، يُعد معيارًا كلاسيكيًا لقياس مدى "تشابه" الآلة بالإنسان. ويعتمد الاختبار على قدرة الذكاء الاصطناعي في إجراء محادثة مع شخص دون أن يتمكن المتلقي من تحديد ما إذا كان يتحدث مع آلة أم إنسان.
في هذه الدراسة، أجرى باحثون من جامعة كاليفورنيا نسخة محدثة من اختبار تورينج، حيث تفاعل المشاركون مع كلٍّ من إنسان حقيقي ونموذج ذكاء اصطناعي، ثم طُلب منهم تحديد من هو الإنسان.
وعندما مُنح GPT-4.5 شخصية محددة ليتقمصها – مثل "شاب مثقف وواعٍ ثقافيًا" – اعتقد المشاركون أنه إنسان في 73% من الحالات. وهي نتيجة تفوق بكثير النسبة العشوائية المتوقعة التي تبلغ 50%.
لكن اللافت أكثر هو أن أداء النموذج تراجع إلى 36% فقط عندما لم يُمنح أي "شخصية" يتقمصها، ما يبرز أهمية السياق والتمثيل السردي في تقنيات الذكاء الاصطناعي الحديثة. في المقابل، سجل النموذج GPT-4o من OpenAI نسبة 21% فقط، في حين حصل الروبوت ELIZA، الذي يعود إلى ستينيات القرن الماضي، على 23%، وفقا لمجلة " نيوزويك".
وعلق كارستن يونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسات العامة، على النتائج بقوله: "لقد وصل الذكاء الاصطناعي إلى مستوى لم يعد الناس قادرين فيه على تمييزه عن البشر في المحادثات النصية. بل تُظهر هذه الدراسة أن الآلة قد تبدو أكثر إنسانية من الإنسان نفسه".
وأضاف: "لقد تجاوزنا 'الوادي الغريب' الذي كانت فيه الروبوتات تُشبه البشر بشكل غير مريح، ودخلنا مرحلة جديدة تمامًا. الذكاء الاصطناعي بات يُستخدم اليوم في العلاج، والدعم النفسي، وحتى الرفقة، وقد يغير جذريًا طريقة تواصلنا عبر الإنترنت".
وتابع يونغ أن السياسات الحكومية لا تزال متأخرة عن هذا التطور المتسارع، مؤكدًا على الحاجة إلى تحديثات تشريعية وتنظيمية تواكب قدرات الذكاء الاصطناعي الحديثة.
وفي تعليق منفصل، كتب الباحث كاميرون جونز عبر منصة X: "تُظهر هذه النتائج أن أنظمة الذكاء الاصطناعي قد تتمكن من أداء مهام بشرية – مثل تقديم الاستشارات القانونية أو التفاعل الاجتماعي – دون أن يدرك الآخرون أنهم لا يتحدثون مع شخص حقيقي".
وحذر جونز من أن هذا التقدم قد يؤدي إلى تغيّرات جذرية في سوق العمل، وزيادة خطورة هجمات الهندسة الاجتماعية، وحتى اضطرابات اجتماعية واسعة.
ما هو اختبار تورينج؟
اختبار تورينج هو تجربة فكرية اقترحها عالم الرياضيات والحوسبة البريطاني آلان تورينج عام 1950 في ورقته الشهيرة "Computing Machinery and Intelligence".
هدف الاختبار: معرفة ما إذا كانت الآلة قادرة على إظهار سلوك ذكي لا يمكن تمييزه عن سلوك الإنسان.
كيف يعمل؟
يتم وضع إنسان (الحكم) في محادثة نصية مع طرفين مخفيين: أحدهما إنسان والآخر آلة (ذكاء اصطناعي).
إذا لم يتمكن (الحكم) من التمييز بدقة بين الآلة والإنسان بناءً على المحادثة، فإن الآلة تُعتبر "ذكية" حسب معايير الاختبار.
ما الجديد في اختبار GPT-4.5؟
في الدراسة الحديثة، طُبِّقت نسخة معدّلة من اختبار تورينج التقليدي، أكثر واقعية ودقة، وجاءت بتغييرات أساسية:
1. مشاركة نماذج متعددة:
تمت مقارنة GPT-4.5 بنماذج مختلفة:
GPT-4o (أحدث إصدار مفتوح من OpenAI)
LLaMA 3.1–405B (من Meta)
ELIZA (أول روبوت محادثة من الستينيات)
2. إضافة "شخصية" للنموذج:
عندما أُعطي GPT-4.5 شخصية مثل "شاب مثقف وواعٍ ثقافيًا"، زادت قدرته على الإقناع بدرجة كبيرة.
النتيجة: تم التعرف عليه بالخطأ كإنسان في 73% من الحالات.
3. وضع بدون شخصية:
عند إزالة الشخصية والتفاعل بشكل عام، تراجعت النتيجة إلى 36% فقط.
4. معيار المقارنة:
المعدل المتوقع عشوائيًا هو 50%.
أي نتيجة أعلى من 50% تعني أن الذكاء الاصطناعي أقنع البشر بإنسانيته أكثر من البشر أنفسهم.
لماذا يعتبر ذلك إنجازًا؟
تاريخيًا: لم يكن أي نموذج سابق يتجاوز البشر في هذا الاختبار.
نفسيًا واجتماعيًا: أصبح الناس يرون الذكاء الاصطناعي أكثر "إنسانية" من الإنسان، عند تقديمه بالشكل المناسب.
تقنيًا: يُظهر أهمية تصميم السياق والشخصيات في أداء الذكاء الاصطناعي.
أمنيًا: قد يؤدي إلى استخدام الذكاء الاصطناعي في الهندسة الاجتماعية أو التلاعب النفسي.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


البوابة العربية للأخبار التقنية
منذ 2 ساعات
- البوابة العربية للأخبار التقنية
تقرير.. الكشف عن ملامح أول جهاز لـ OpenAI
كشفت صحيفة وول ستريت جورنال أن أول جهاز تعمل عليه OpenAI بالتعاون مع مصمم آبل السابق جوني آيف لن يكون هاتفًا ذكيًا ولا جهازًا قابلًا للارتداء، بل قد لا يحتوي حتى على شاشة، مما يشير إلى توجه مبتكر وغير تقليدي في فئة الأجهزة الذكية. ويأتي ذلك بعد إعلان شركة OpenAI استحواذها على شركة io الناشئة التي أسسها آيف، في صفقة تُقدّر قيمتها بـ 6.5 مليارات دولار. ووفقًا للتقرير، فقد أبلغ الرئيس التنفيذي سام ألتمان موظفي الشركة بأن لديهم الآن 'فرصة لإنجاز أعظم مشروع في تاريخ OpenAI'. وأشار كل من آيف وألتمان إلى بعض ملامح الجهاز الجديد، إذ أوضحا أنه سيكون واعيًا تمامًا بمحيطه وبنشاطات المستخدم، كما سيتميز بتصميم غير مزعج يمكن وضعه في الجيب أو على المكتب، ومن المتوقع أن يتحوّل إلى أحد الأجهزة الأساسية للمستخدمين بعد الحاسوب والهاتف. وبحسب التقرير، فإن الجهاز لن يكون هاتفًا أو نظارة ذكية، وهو ما يعكس رغبة الفريق في تقليل الاعتماد على الشاشات، إذ يطمح آيف وألتمان إلى 'فطام المستخدمين' عن الأجهزة التقليدية القائمة على العرض البصري. وتعتزم الشركة الحفاظ على سرية تصميم الجهاز ومواصفاته حتى لحظة الإطلاق، تفاديًا لمحاولات التقليد من المنافسين. وتخطط الشركة لإطلاق الجهاز الجديد في أواخر عام 2026 مع هدف طموح، وهو شحن 100 مليون وحدة بأسرع وتيرة في تاريخ صناعة الأجهزة الذكية. ووفقًا للتقرير، فقد بدأ فريق آيف منذ أربعة أشهر بالتفاوض مع موردين قادرين على تصنيع الجهاز على نطاق واسع، وذلك بعد تعاون دام أكثر من عام ونصف مع OpenAI، إذ كان الهدف الأولي تطوير منتج يعتمد على تقنيات الذكاء الاصطناعي التوليدي من OpenAI، قبل أن تقرر الأخيرة الاستحواذ الكامل على الشركة. وتبقى الأسئلة معلقة حول طبيعة هذا الجهاز الجديد، ومدى قدرة التصميم المبتكر والتقنية المتقدمة على إقناع المستخدمين باقتناء فئة جديدة بالكامل من الأجهزة، خاصةً بعد إخفاق محاولات مشابهة مثل جهاز Ai Pin من شركة Humane، الذي توقفت خدماته نهائيًا مطلع العام الجاري.


البوابة العربية للأخبار التقنية
منذ 3 ساعات
- البوابة العربية للأخبار التقنية
OpenAI تستحوذ على شركة 'io' لتصميم الأجهزة الذكية
أعلنت شركة OpenAI استحواذها على شركة io الناشئة والمتخصصة في تطوير العتاد الذكي، وهي الشركة التي أسّسها مصمم آبل الشهير جوني آيف إلى جانب عدد من المهندسين البارزين الذين عملوا سابقًا معه في آبل، منهم سكوت كانون، وإيفانز هانكي، وتانغ تان. ووفقًا لتقرير نشرته وكالة بلومبرج، فإن قيمة الصفقة تُقدّر بنحو 6.5 مليارات دولار، وتشمل انتقال نحو 55 من مهندسي العتاد والمطورين والخبراء في التصنيع إلى صفوف OpenAI، ومنهم الأسماء الثلاثة البارزة المشاركة في التأسيس. ومع أن جوني آيف لن ينضم رسميًا إلى OpenAI، فإن شركته التصميمية LoveFrom ستتولى مهام التصميم لكافة منتجات OpenAI المستقبلية والبرمجيات الخاصة بها، مع الحفاظ على استقلاليتها. ومن المتوقع إطلاق أولى الأجهزة الناتجة عن هذا التعاون الجديد في عام 2026. وقد أشار آيف في مقابلة مع وكالة بلومبرغ إلى أن معظم الأجهزة المدعومة بالذكاء الاصطناعي التي طُرحت حديثًا مثل Humane Pin و Rabbit R1 كانت 'منتجات سيئة للغاية'، مضيفًا أن 'المنتجات الحالية تفتقر إلى أفكار جديدة وجريئة'. وأكد الرئيس التنفيذي لـOpenAI، سام ألتمان، أن أول منتج يعمل عليه الفريق 'ليس بديلًا للهاتف الذكي'، موضحًا أنه: 'كما أن الهواتف لم تلغِ وجود الحواسيب المحمولة، فإن المنتج الجديد لن يلغي الهاتف، بل يشكّل فئة مختلفة بالكامل'. ووصف آيف هذا المنتج بأنه 'جهاز استحوذ بالكامل على خيال الفريق'، في حين قال ألتمان: 'لقد سلّمني جوني حديثًا أحد النماذج الأولية، وقد عشت معه لبعض الوقت، وأعتقد أنه من أروع ما أنتجته التكنولوجيا حتى الآن'. وفي منشور مشترك، قال آيف وألتمان: 'لقد جمعنا أفضل المهندسين في العتاد والبرمجيات، وأمهر العلماء والخبراء في تطوير المنتجات وتصنيعها. لقد عمل الكثير منا معًا لعقود من الزمن. وسيتم إدماج فريق io في OpenAI للعمل من قرب مع فرق البحث والهندسة في سان فرانسيسكو'. وأضاف ألتمان قائلًا: 'إن الذكاء الاصطناعي تقنية مذهلة، لكن الأدوات العظيمة تحتاج إلى تصميم يقوم على فهم عميق للتكنولوجيا والناس والعالم. ولا أحد يُجيد هذا المزيج كما يجيده جوني وفريقه، فهم يهتمون بأدق التفاصيل'. وأما آيف، فقد أعرب عن امتنانه لهذه الفرصة، قائلًا: 'إنني أشعر أن كل ما تعلمته على مدار الثلاثين عامًا الماضية قد قادني إلى هذه اللحظة. إن المسؤولية جسيمة، لكنني متحمّس وممتن لهذه الشراكة الملهمة'.

سكاي نيوز عربية
منذ 7 ساعات
- سكاي نيوز عربية
تغيير مفهوم البحث.. من الروابط إلى المحادثات الذكية
في هذا السياق، تعد التحديثات التقنية جزء من "إعادة تصور شاملة لعالم البحث"، كما وصفها قادة الصناعة. ومن هنا صارت المنافسة تدور حول من يملك أكبر قاعدة بيانات أو أسرع خوارزمية، ومن ينجح في تحويل محرك البحث إلى شريك ذكي يفهم السياق ويدرك القصد، ويقدّم حلولًا تتجاوز النصوص إلى الفهم. تُجدد شركة غوغل محرك البحث الخاص بها لإضافة ميزات تسمح له بالعمل بشكل مشابه لروبوت الدردشة بالذكاء الاصطناعي، حيث تتنافس الشركة مع منافسين مثل OpenAI. ابتداءً من يوم الثلاثاء، تم تفعيل "وضع الذكاء الاصطناعي" في بحث غوغل ومتصفح كروم ، والذي سيوفر تجربة محادثة وأسئلة وأجوبة تشبه ChatGPT من OpenAI ، بدلاً من قائمة تقليدية من الروابط. الرئيس التنفيذي لشركة ألفابت ، الشركة الأم لغوغل، سوندار بيتشاي، وصف هذه الخطوة بأنها "إعادة تصور شاملة لعالم البحث"، وذلك خلال مؤتمرها السنوي للمطورين في ماونتن فيو هذا الأسبوع. يمثل هذا الإصدار أحدث الجهود المبذولة لدمج الذكاء الاصطناعي المُولِّد في محرك البحث المهيمن لغوغل، حتى مع قلق المستثمرين من أن المنتجات الجديدة ستُهدر موارده المالية، بحسب تقرير لصحيفة "فايننشال تايمز" البريطانية. كان بيتشاي قد تعرّض لانتقادات بسبب بطء وتيرة إصدارات الذكاء الاصطناعي ، بعد أن كانت غوغل رائدة الصناعة في تطوير الأبحاث التي أدت إلى طفرة الذكاء الاصطناعي التوليدي. وقد سمح ذلك لشركات ناشئة مثل OpenAI وAnthropic بالنمو لتصبح شركات بمليارات الدولارات، وبدأت تتحدى احتكار غوغل للاستعلامات عبر الإنترنت. استجابةً لذلك، اضطرت غوغل إلى تسريع جدول إطلاقها وإجراء تحسينات سريعة على نموذجها اللغوي الكبير جيميني. وتزعم أن الإصدار 2.5 الأحدث يتفوق على ChatGPT من OpenAI وClude من Anthropic في العديد من اختبارات الأداء، وخاصةً في البرمجة. قال بيتشاي إن غوغل لا تزال تتمتع بميزة توزيعية هائلة على منافسيها، إذ تُجري 8.5 مليار استفسار يوميًا. وأضاف: "يُتيح البحث الذكاء الاصطناعي لعدد أكبر من الناس مقارنةً بأي منتج آخر في العالم". في حديثه مع "اقتصاد سكاي نيوز عربية"، يشير المستشار الأكاديمي في جامعة سان خوسيه الحكومية في كاليفورنيا، أحمد بانافع، إلى أن تأثير خطوة غوغل الأخيرة على سباق الذكاء الاصطناعي ، مُبرزاً عدداً من محاور التأثير الرئيسية على النحو التالي: تسريع وتيرة الابتكار: بدمج غوغل للذكاء الاصطناعي التخاطبي في محرك بحثها، تزداد المنافسة مع لاعبين مثل OpenAI التي طورت ChatGPT ، ومايكروسوفت التي دمجت ChatGPT في Bing. هذه المنافسة تدفع الجميع إلى تسريع وتيرة البحث والتطوير لتقديم نماذج ذكاء اصطناعي أكثر قوة ودقة وقدرة على فهم اللغة البشرية وإنشاء محتوى ذي صلة. تركيز على التطبيقات العملية: بدلًا من مجرد تطوير نماذج نظرية، تضغط هذه الخطوة على الشركات لتركيز جهودها على دمج الذكاء الاصطناعي في منتجاتها الأساسية، مما يعني تسريع ظهور تطبيقات عملية ومفيدة للمستخدمين. تغيير تعريف "البحث".. من الروابط إلى الإجابات المباشرة: يتجه البحث من مجرد تقديم قائمة بالروابط إلى تقديم إجابات مباشرة ومُلخصة، مدعومة بمصادر متعددة. هذا يغير طريقة تفاعل المستخدمين مع المعلومات، ويجعل البحث أكثر تفاعلية و"محادثية". التركيز على فهم السياق والقصد: ستتطلب محركات البحث المدعومة بالذكاء الاصطناعي فهمًا أعمق لسياق استفسارات المستخدمين وقصدهم، وليس فقط الكلمات المفتاحية. هذا سيدفع حدود تطور معالجة اللغة الطبيعية . أما لجهة تأثير تلك الخطوة على نماذج الأعمال، يتحدث بانافع عن الإعلانات بشكل خاص، ذلك أنه "قد يؤثر تقديم إجابات مباشرة من الذكاء الاصطناعي على نموذج الإعلانات التقليدي لمحركات البحث، حيث قد لا يضطر المستخدمون إلى النقر على الروابط بنفس القدر، وهذا يدفع غوغل وغيرها للبحث عن طرق جديدة لدمج الإعلانات بشكل طبيعي وغير مزعج ضمن تجربة البحث القائمة على الذكاء الاصطناعي". أما لجهة نمو سوق الذكاء الاصطناعي للمحادثات، فمن المتوقع أن تنمو سوق الذكاء الاصطناعي للمحادثات بشكل كبير، حيث تتبنى الشركات هذه التقنيات لخدمة العملاء، والتسويق، وتحليل البيانات. وكان المسؤولون التنفيذيون متحفظين بشأن كيفية تخطيطهم لدمج الإعلانات في عروض البحث الجديدة القائمة على الذكاء الاصطناعي والمتصفحات والتطبيقات. حققت غوغل 50 مليار دولار من إيرادات إعلانات البحث في الربع الأول ، أي أكثر من نصف إجمالي إيرادات ألفابت البالغة 90 مليار دولار. نهج شامل ويشير تقرير لصحيفة الغارديان البريطانية إلى مثال آخر على نهج غوغل الشامل في مجال الذكاء الاصطناعي، إذ كشفت الشركة عن خططها لإعادة دخول سوق النظارات الذكية بنظارة جديدة تعمل بنظام أندرويد XR. تأتي المعاينة الأولية للجهاز القادم، الذي يتضمن كاميرا تعمل بدون استخدام اليدين ومساعدًا صوتيًا للذكاء الاصطناعي، بعد 13 عامًا من إطلاق نظارة غوغل جلاس ، وهي منتج ألغت الشركة طرحه بعد ردود فعل غاضبة من الجمهور بسبب مخاوف تتعلق بالخصوصية. لم تُعلن غوغل عن موعد طرح نظارات أندرويد XR أو سعرها، لكنها كشفت أنها ستُصمم بالتعاون مع شركتي جنتل مونستر وواربي باركر. وستُنافس هذه النظارات منتجًا مشابهًا متوفرًا بالفعل في السوق من شركتي ميتا بلاتفورمز، الشركة الأم لفيسبوك، وراي بان. وبحسب التقرير، يعتمد التوسع على التحول الذي بدأته غوغل قبل عام مع تقديم ملخصات المحادثة التي تسمى "نظرة عامة على الذكاء الاصطناعي" والتي تظهر بشكل متزايد في الجزء العلوي من صفحة نتائجها وتتفوق على تصنيفاتها التقليدية لروابط الويب. وفقاً لغوغل، يتفاعل الآن حوالي 1.5 مليار شخص بشكل منتظم مع "نظرة عامة على الذكاء الاصطناعي"، ويقوم معظم المستخدمين الآن بإدخال استعلامات أطول وأكثر تعقيدًا. من جانبه، يقول استشاري العلوم الإدارية وتكنولوجيا المعلومات في G&K، عاصم جلال، لموقع "اقتصاد سكاي نيوز عربية": "خطوة غوغل الأخيرة تُعد تطورًا مهمًا للغاية في ظل التحولات الكبيرة التي نشهدها في طريقة استخدام الناس لمحركات البحث". الكثير من المستخدمين بدأوا بالفعل يعتمدون على روبوتات الذكاء الاصطناعي مثل ChatGPT وBard وGrok التابعة لشركات مثل OpenAI وGoogle وxAI، كبدائل للحصول على المعلومات. هذا التوجه يمثل تهديدًا واضحًا لغوغل، لأن نموذجها الأساسي للإيرادات يعتمد بشكل كبير على الإعلانات المرتبطة بعمليات البحث، خاصة وأن متصفح كروم ونظام أندرويد يُقدمان مجانًا، ما يجعل الإعلانات هي المصدر الرئيسي للتمويل. إذا استمرت هذه الظاهرة وبدأ المستخدمون في استبدال البحث التقليدي بالمحادثات مع روبوتات الذكاء الاصطناعي، سيكون لذلك أثر كبير على غوغل. وهنا برز التساؤل: كيف ستتعامل غوغل مع هذا التغيير؟ وهل ستستمر في الاعتماد على الإعلانات؟ وإذا نعم، فكيف سيكون شكل الإعلان في سيناريو يُجري فيه المستخدم محادثة مع ذكاء اصطناعي بدلًا من تصفح نتائج بحث تقليدية؟ ويضيف: في المقابل، نماذج الأعمال الخاصة بالشركات الأخرى مثل OpenAI تعتمد على الاشتراكات، وحتى إن لم تكن هذه الاشتراكات تُغطي التكاليف بشكل كامل حتى الآن، إلا أنها تستند إلى استراتيجية معروفة وهي جذب المستثمرين من خلال إظهار القدرة المستقبلية على تحقيق أرباح ضخمة بفضل الحصة السوقية الكبيرة التي يتم اكتسابها الآن. هذا الأسلوب اتبعته شركات كبرى من قبل مثل فيسبوك، حيث ركزت في البداية على التوسع وانتشار الخدمة، ثم بدأت بتحقيق الأرباح. أما غوغل، فهي تمتلك بالفعل الحصة السوقية والدخل، وبالتالي لا يمكنها التضحية بمصدر دخلها الرئيسي بسهولة، وهي الآن تواجه تحديًا حقيقيًا في كيفية التكيف مع هذا التحول في سلوك المستخدمين دون أن تخسر مكانتها المالية."