الذكاء الاصطناعي ينجح في اجتياز اختبار "العقل البشري"

تصدرت أخبار نجاح روبوتات الذكاء الاصطناعي في اجتياز اختبار تورينغ الشهير، مما أثار جدلاً واسعًا حول قدرات الذكاء الاصطناعي.
واستندت هذه التقارير إلى دراسة حديثة أجراها باحثان من جامعة كاليفورنيا في سان دييغو، حيث تم اختبار أربعة نماذج لغوية كبيرة (LLMs) باستخدام اختبار تورينغ". والنتيجة كانت مفاجئة، حيث تم تصنيف نموذج GPT-4.5 من OpenAI على أنه غير قابل للتمييز عن الإنسان بنسبة 70% من الوقت.
ما هو اختبار تورينغ؟
يُعد اختبار تورينغ واحدًا من أشهر المعايير لقياس الذكاء الاصطناعي، وقد اقترحه عالم الرياضيات البريطاني آلان تورينغ عام 1950 في مقاله الشهير "الآلات الحاسوبية والذكاء". يهدف الاختبار إلى تحديد قدرة الآلة على محاكاة سلوك الإنسان، بحيث يتمكن المُحقق من التمييز بين الإنسان والآلة بناءً على المحادثات النصية فقط. إذا كانت الآلة قادرة على إقناع المحقق بأنها إنسان، فهذا يعني أنها قد "نجحت" في اجتياز الاختبار.
تفاصيل الدراسة
ووفقاً لموقع "the conversation" تركزت الدراسة التي أجراها كاميرون جونز وبنيامين بيرغن، والتي تم نشرها في مارس الماضي، على اختبار أربعة نماذج لغوية كبيرة: ELIZA GPT-4o، LLaMa-3.1-405B، وGPT-4.5.
تم تصميم الاختبار بحيث يتفاعل المشاركون في محادثات نصية ضمن ثمانية جولات، حيث يكون كل مشارك إما مُحققًا أو شاهدًا (إنسان أو آلة).
تتكون كل جولة من محادثة مع شخصين عبر شاشة منقسمة، بحيث يتفاعل المشاركون مع كل شخص لمدة خمس دقائق، ثم عليهم تحديد أيهما إنسان وأيهما نموذج لغوي.
مع استخدام واجهة مشابهة لتطبيقات المراسلة التقليدية، أظهرت النتائج أن GPT-4.5 تم تصنيفه على أنه إنسان بنسبة 73% من الوقت، بينما LLaMa-3.1-405B تم تصنيفه كإنسان بنسبة 56%. أما ELIZA وGPT-4o فقد نجحا في خداع المشاركين بنسبة 23% و21% على التوالي.
اقرأ أيضاً.. الذكاء الاصطناعي يهدد الذكاء البشري
هل هذا يعني أن الذكاء الاصطناعي يملك ذكاءً بشريًا؟
رغم النتائج المثيرة، لا يعني أن اجتياز اختبار تورينغ يعني أن النموذج يمتلك "الذكاء البشري". الباحثون في الدراسة شددوا على أن اختبار تورينغ هو مقياس للتقليد وليس الذكاء الفعلي. وبعبارة أخرى، إذا تمكن النموذج من محاكاة سلوك الإنسان بمهارة عالية، فهذا لا يعني أنه يمتلك الوعي أو التفكير البشري.
على الرغم من ذلك، يبقى اختبار تورينغ محط جدل. فبعض الباحثين يعتبرون أن مجرد اجتياز الاختبار ليس دليلاً على امتلاك الآلة لذكاء حقيقي. هذه الفكرة كانت محل نقاش منذ البداية، حيث أشار بعض العلماء إلى أن الاختبار لا يختبر الذكاء الفعلي بل مجرد قدرة الآلة على تقليد الذكاء البشري في سياقات محددة.
الاعتراضات على اختبار تورينغ
إلى جانب الجدل حول معايير الاختبار، توجد أيضًا اعتراضات رئيسية على فعالية اختبار تورينغ كمعيار للذكاء الاصطناعي:
السلوك مقابل التفكير: يعتقد بعض العلماء أن القدرة على اجتياز الاختبار تتعلق بالسلوك المحاكي فقط، وليس بالذكاء الفعلي. إذ يمكن للآلة أن تحاكي سلوك الإنسان دون أن تفكر كما يفعل الإنسان.
الدماغ ليس آلة: طرح تورينغ أن الدماغ البشري يمكن تفسيره على أنه آلة، لكن العديد من الأكاديميين يرفضون هذا الرأي، معتبرين أن الدماغ ليس آلة ميكانيكية يمكن تقليدها.
محدودية الاختبار: يرى البعض أن اختبار تورينغ لا يغطي سوى سلوك واحد من السلوكيات التي يمكن أن تظهرها الآلات، وأنه لا يعد مقياسًا شاملاً للذكاء.
اقرأ أيضاً.. "آخر اختبار للبشرية".. التحدي الأخير أمام الذكاء الاصطناعي لاجتياز قدرات البشر
هل أصبح الذكاء الاصطناعي مشابهًا للبشر؟
رغم أن GPT-4.5 قد نجح في اجتياز اختبار تورينغ، فإن هذا لا يعني بالضرورة أنه أصبح بنفس مستوى الذكاء البشري. الباحثون في الدراسة يؤكدون أن اختبار تورينغ لا يعكس الذكاء البشري الحقيقي، بل هو مجرد مقياس لمدى قدرة الآلة على محاكاة سلوك الإنسان.
إلى الآن، لا يزال الذكاء الاصطناعي بعيدًا عن الوصول إلى الذكاء البشري الفعلي، رغم أنه قادر على تقليده بشكل متقن في بعض الأحيان.
إسلام العبادي(أبوظبي)

هاشتاغز

علوم

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

أخبار ذات صلة

"أبل" قد تحيلها على التقاعد أو تفصلها .. هواتف آيفون قريباً دون "سيري"

الإمارات اليوم

منذ 5 ساعات

الإمارات اليوم

"أبل" قد تحيلها على التقاعد أو تفصلها .. هواتف آيفون قريباً دون "سيري"

لطالما كانت المساعدة الافتراضية "سيري" ركنًا أساسًا في شركة أبل لسنوات، لكن الأمر قد يتغير الآن، بعد سماح الشركة باستبدال سيري بمساعدين صوتيين آخرين. ولا يتخيل الكثيرون عالمًا لا تكون فيه "سيري" حاضرة لتلبية جميع احتياجاتهم والإجابة عن جميع أسئلتهم. لكن الآن، فتحت أبل نظام iOS لتطبيقات الجهات الخارجية، وقد تختفي سيري من أجهزة آيفون. وقبل أكثر من عام بقليل، اضطرت أبل لإجراء هذا التغيير، وأصبح أحد أكبر التغييرات في تاريخ آيفون، وسمح للمستخدمين في الاتحاد الأوروبي بتثبيت التطبيقات من خلال متاجر خارجية. وكانت هذه خطوة غير مسبوقة، فحتى ذلك الحين، كانت أبل تختار بعناية الشركات التي يمكنها التفاعل مع أجهزتها. وبالفعل، بدأت أبل بإعادة تصميم بعض أنظمة تشغيلها الخاصة لتتكيف مع لوائح الاتحاد الأوروبي المُخطط لها، والتي ستُجبرها على السماح للمستخدمين باستبدال سيري بمساعدين صوتيين آخرين إذا أرادت الاستمرار في العمل داخل حدود الاتحاد. ومع أن "سيري" هي المساعدة الافتراضية لشركة أبل، ولكن مع صعود الذكاء الاصطناعي، لم تعد هي الأداة الوحيدة أو الأكثر كفاءة في الإجابة على الاستفسارات، وهذا يعني أن المستخدمين قد يضطرون إلى استخدام موارد أكثر جودة لتحل محلها. ولعل التغيير الآخر الأهم هو أن أبل تخطط للتكامل مع "ChatGPT"، تقنية الذكاء الاصطناعي الجديدة التي أحدثت ضجة كبيرة في العالم. وبفضل هذه الشراكة الجديدة، ستتمكن أبل من استخدام روبوت المحادثة "OpenAI" للإجابة عن الاستفسارات التي لا تستطيع سيري الإجابة عنها. ومع ذلك، من المهم التذكير بأن أبل لم تؤكد هذا الخبر. وفي السياق عينه، أعلنت شركة أبل بالفعل أنها تعمل على توفير المزيد من التكامل في نظام التشغيل، ومن المتوقع أن تتيح للمستخدمين استخدام جيميني الخاص على "غوغل" بنفس طريقة استخدام "ChatGPT" الحالية. وكذلك، أفادت التسريبات أن أبل تجري محادثات مع "Perplexity" أيضًا، لتوفير نسخة من أداة الذكاء الاصطناعي مخصصة لهواتف آيفون.

Claude Opus 4 وSonnet 4: أنثروبيك تتفوق على عمالقة الذكاء الاصطناعي

عرب هاردوير

منذ 11 ساعات

عرب هاردوير

Claude Opus 4 وSonnet 4: أنثروبيك تتفوق على عمالقة الذكاء الاصطناعي

كشفت شركة أنثروبيك (Anthropic)، إحدى أبرز الشركات الناشئة في مجال الذكاء الاصطناعي، عن الجيل الجديد من نماذجها اللغوية، Claude Opus 4 وClaude Sonnet 4، والتي تُعتبر من بين أكثر النماذج تقدمًا في مُعالجة المهام البرمجية وحل المشكلات المُعقدّة. Claude Opus 4: أقوى نموذج برمجي حتى الآن وصفت أنثروبيك Claude Opus 4 بأنه "أفضل نموذج برمجي في العالم"، حيث تفوّق على مُنافسيه مثل Google Gemini 2.5 Pro وGPT-4.1 من OpenAI في اختبارات البرمجة والاستدلال المنطقي. ومن أبرز ميزاته: القدرة على العمل بشكل مُستمر لعدّة ساعات، حيث استمر في مُعالجة المهام لمُدّة تصل إلى 7 ساعات خلال الاختبارات. أداء متفوق في استخدام الأدوات مثل البحث عبر الويب ومُعالجة البيانات المُعقدّة. تحسينات كبيرة في تخزين المعلومات أثناء المهام الطويلة، خاصةً عند الوصول إلى الملفات المحلية. Claude Sonnet 4: نموذج متوازن بتكلفة أقل أمّا Claude Sonnet 4 ، فهو إصدار أكثر كفاءة من حيث التكلفة، ومُصمّم للمهام العامة. ويأتي كخليفة لـ Sonnet 3.7 الذي أُطلق في فبراير 2024. ومن مميزاته: تحسينات في الدقة والاستدلال المنطقي. قدرة أعلى على تجنُّب الحلول المُختصرة وغير الموثوقة بنسبة 65⁒ مُقارنةً بالإصدارات السابقة. ميزات جديدة لتحسين التفاعل مع المستخدم أضافت أنثروبيك ميزتين رئيسيتين لكلا النموذجين: "ملخصات التفكير": تُبسّط طريقة عرض تحليل النموذج للمعلومات، والذي يُسهّل فهمها. "التفكير الموسّع": تتيح للمُستخدمين التحكم في أنماط الاستدلال، لزيادة الدقة في المهام المُعقدّة. التوافر والخطّط السعرية يتوفر النموذجان عبر: واجهة برمجة التطبيقات (API) الخاصة بأنثروبيك. منصتّي Amazon Bedrock وGoogle Cloud Vertex AI. أمّا بالنسبة للخطط السعرية: يمكن لمُستخدمي الحسابات المدفوعة الوصول إلى Claude Opus 4 وتجربة ميزة "التفكير الموسّع" في نسختها التجريبية. بينما يقتصر المستخدمون المجانيون على Claude Sonnet 4. بالتوازي مع ذلك، أعلنت أنثروبيك عن الإطلاق الرسمي لأداة Claude Code، وهي أداة ذكية لمُساعدة المُطورين في كتابة الأكواد البرمجية، بعد أن كانت مُتاحة في وضع تجريبي مُنذ فبراير الماضي. استراتيجية أنثروبيك في مواجهة المُنافسة تسعى أنثروبيك إلى تعزيز وجودها في سوق الذكاء الاصطناعي التنافسي، وتخطط لإضافة تحديثات مُتكررة لنماذجها لمواكبة التطورات السريعة من OpenAI (مُطورة ChatGPT) وجوجل وميتا. مع إطلاق Claude Opus 4 وSonnet 4، تؤكّد أنثروبيك مكانتها كمُنافس قوي في مجال الذكاء الاصطناعي، خاصةً في المهام البرمجية وحل المشكلات المُعقدّة. ومن المُتوقع أن تزداد حدّة المُنافسة في هذا القطاع مع تسارُّع وتيرة التطوير من جميع الأطراف.

جهاز بلا شاشة.. «أوبن إيه آي» و«جوني آيف» يعيدان تعريف التكنولوجيا

العين الإخبارية

منذ 16 ساعات

العين الإخبارية

جهاز بلا شاشة.. «أوبن إيه آي» و«جوني آيف» يعيدان تعريف التكنولوجيا

تم تحديثه الجمعة 2025/5/23 11:26 م بتوقيت أبوظبي في خطوة جريئة لإعادة رسم ملامح الأجهزة الذكية، تعمل شركة OpenAI بالتعاون مع مصمم أبل الأسطوري جوني آيف على تطوير جهاز جديد لا يشبه أي شيء موجود حاليا: لا هاتف، لا نظارات، ولا حتى شاشة. وفقا لصحيفة "صحيفة وول ستريت جورنال"، هذا المشروع الطموح جاء عقب استحواذ OpenAI على شركة io الناشئة التي أسسها آيف، في صفقة قدرتها المصادر بنحو 6.5 مليار دولار. ووصف سام ألتمان، الرئيس التنفيذي لـ OpenAI، الجهاز بأنه "أعظم مشروع في تاريخ الشركة". الجهاز سيكون صغيرا، بواجهة غير مزعجة، يمكن حمله في الجيب أو وضعه على المكتب، ويتميز بإدراك بيئي كامل لما يجري حوله. الهدف، بحسب آيف وألتمان، هو ابتكار جهاز يحرر المستخدم من الشاشة، ويشكل بديلا ثالثا بعد الحاسوب والهاتف. OpenAI تخطط لإطلاق الجهاز بحلول نهاية عام 2026، مع طموح ببيع 100 مليون وحدة في أسرع وقت زمني في تاريخ سوق الأجهزة الذكية. تحيط الشركة المشروع بسرية تامة، لتفادي محاولات التقليد، خصوصًا بعد تجارب فاشلة لأجهزة مماثلة مثل Ai Pin من شركة Humane، الذي توقف تماما في مطلع 2025. منذ أربعة أشهر، بدأ فريق آيف مفاوضات مع موردين لتصنيع الجهاز على نطاق واسع، بعد أكثر من عام ونصف من التعاون مع OpenAI على تطوير منتج يستند إلى تقنيات الذكاء الاصطناعي التوليدي. هل تنجح OpenAI في إقناع العالم بجهاز بلا شاشة في عصر يعشق اللمس والتفاعل البصري؟ aXA6IDgyLjI0LjI0My4xMDYg جزيرة ام اند امز GB