أحدث الأخبار مع #إلينورواتسون،


الاتحاد
٢٨-٠٤-٢٠٢٥
- علوم
- الاتحاد
كيف نقيس ذكاء الآلات؟ أداء المهام الطويلة والمعقدة يكشف الإجابة!
ابتكر علماء طريقة جديدة لقياس مدى كفاءة أنظمة الذكاء الاصطناعي (AI)، وذلك عبر تقييم سرعة أدائها مقارنة بالبشر في تنفيذ المهام الصعبة. وعلى الرغم من أن أنظمة الذكاء الاصطناعي تتفوق عادة على البشر في مهام التنبؤ بالنصوص والمعرفة العامة، إلا أنها تظهر فاعلية أقل عند تكليفها بمشاريع أكثر تعقيدًا، مثل تقديم المساعدة التنفيذية عن بُعد. ولغرض قياس هذه الفجوة في الأداء بدقة، اقترحت دراسة جديدة تقييم أنظمة الذكاء الاصطناعي بناءً على مدة إنجازها للمهام مقارنة بالوقت الذي يحتاجه الإنسان للقيام بالمهمة نفسها. وقد نشر الباحثون نتائجهم عبر قاعدة بيانات الأبحاث الأولية arXiv، ومازالت في طور الدراسة. بحسب موقع livescience . اقرأ أيضاً..644 مليار دولار الإنفاق العالمي على الذكاء التوليدي خلال 2025 قياس مدة المهام قال الباحثون "إنهم وجدوا أن قياس مدة المهام التي يمكن للنماذج إكمالها يعد وسيلة مفيدة لفهم قدرات الذكاء الاصطناعي الحالية. إذ يبدو أن وكلاء الذكاء الاصطناعي غالبًا ما يواجهون صعوبة في ربط سلسلة من الإجراءات الطويلة معًا أكثر من افتقارهم إلى المهارات أو المعرفة اللازمة لحل خطوات فردية." وقد أظهرت نتائج الدراسة أن نماذج الذكاء الاصطناعي أتمت المهام التي تستغرق أقل من أربع دقائق بالنسبة للبشر بنسبة نجاح تقارب 100%. ولكن نسبة النجاح انخفضت بشكل حاد إلى 10% فقط للمهام التي تستغرق أكثر من أربع ساعات. لاحظ الباحثون أن النماذج الأقدم من الذكاء الاصطناعي كان أداؤها أضعف في إنجاز المهام الطويلة مقارنة بالأنظمة الأحدث، وهو أمر كان متوقعًا. وأشارت الدراسة إلى أن طول المهام التي تستطيع نماذج الذكاء الاصطناعي العامة إكمالها بنسبة موثوقية تبلغ 50% قد تضاعف تقريبًا كل سبعة أشهر خلال السنوات الست الماضية. حدود جديدة لقياس قدرات الذكاء الاصطناعي؟ قد يمثل هذا المعيار الجديد المحتمل خطوة مهمة لفهم مستوى الذكاء والقدرات الحقيقية لأنظمة الذكاء الاصطناعي بشكل أفضل. قال الباحث سهراب كازيرونيان:"من غير المرجح أن يغير هذا المقياس نفسه مسار تطوير الذكاء الاصطناعي، لكنه سيساعد في تتبع مدى سرعة التقدم المحرز في أنواع معينة من المهام التي من المتوقع أن تُستخدم فيها أنظمة الذكاء الاصطناعي". وأضاف: "قياس أداء الذكاء الاصطناعي بناءً على المدة الزمنية التي يستغرقها البشر لإنجاز مهمة معينة يُعد مقياسًا بديلاً مثيرًا للاهتمام لقياس الذكاء والقدرات العامة. أولاً: لأنه لا يوجد مقياس واحد يعبر بدقة عما نعنيه بكلمة (ذكاء). ثانيًا: لأن احتمالية تنفيذ مهمة طويلة الأمد من دون انحراف أو خطأ تصبح منخفضة للغاية. وثالثًا: لأنه يمثل مقياسًا مباشرًا لنوع المهام التي نطمح لاستخدام الذكاء الاصطناعي فيها، وهي حل المشكلات المعقدة التي يواجهها البشر. ورغم أن هذا المقياس قد لا يغطي جميع الجوانب الدقيقة لقدرات الذكاء الاصطناعي، إلا أنه بلا شك يمثل مؤشرًا مهمًا ومفيدًا". من جانبها، أيدت إلينور واتسون، عضوة في معهد مهندسي الكهرباء والإلكترونيات (IEEE) ومهندسة أخلاقيات الذكاء الاصطناعي في جامعة Singularity، أهمية هذه الأبحاث. وقالت:"إن قياس أداء الذكاء الاصطناعي بناءً على مدة إنجاز المهام يُعد أداة (قيمة وبديهية)، إذ يعكس تعقيدات العالم الواقعي بشكل مباشر، ويقيس مدى قدرة أنظمة الذكاء الاصطناعي على الحفاظ على سلوك منظم وموجه نحو الهدف على مدى فترات زمنية طويلة"، مقارنة بالاختبارات التقليدية التي تقيم أداء الذكاء الاصطناعي في مشكلات قصيرة ومعزولة. تسارع تطور الذكاء الاصطناعي يبشر بعصر الوكلاء العامين بعيدًا عن تقديم مقياس معياري جديد، يكمن الأثر الأكبر للدراسة في تسليط الضوء على السرعة المتزايدة لتطور أنظمة الذكاء الاصطناعي، خاصة في قدرتها المتنامية على التعامل مع المهام الطويلة والمعقدة. وفي هذا السياق، تتوقع إلينور واتسون أن ظهور وكلاء ذكاء اصطناعي عامين قادرين على أداء مجموعة متنوعة من المهام أصبح وشيكًا. وأضافت واتسون:"بحلول عام 2026، سنشهد تحول الذكاء الاصطناعي ليصبح أكثر عمومية، حيث سيتمكن من التعامل مع مهام متنوعة تمتد على مدار يوم كامل أو أسبوع، بدلاً من الاكتفاء بمهام قصيرة ومحددة النطاق". وأشارت إلى أن هذا التطور قد يحمل تأثيرات كبيرة على قطاع الأعمال، إذ يمكن لأنظمة الذكاء الاصطناعي حينها تولي جزء كبير من أعباء العمل الاحترافية، مما قد يؤدي إلى خفض التكاليف، وزيادة الكفاءة، وفي الوقت نفسه إتاحة الفرصة للبشر للتركيز على المهام الإبداعية والاستراتيجية والتفاعلية مع الآخرين. الذكاء الاصطناعي ينتقل من دور المساعد إلى مدير شخصي موثوق قالت إلينور واتسون إن الذكاء الاصطناعي، بالنسبة للمستهلكين، سيتطور من مجرد مساعد بسيط إلى مدير شخصي موثوق، قادر على التعامل مع مهام حياتية معقدة، مثل تخطيط السفر، ومراقبة الصحة، وإدارة المحافظ المالية،على مدار أيام أو أسابيع، مع الحاجة إلى إشراف بشري محدود للغاية.وترى أن قدرة أنظمة الذكاء الاصطناعي على تنفيذ مجموعة واسعة من المهام الطويلة قد تُحدث تأثيرًا كبيرًا في طريقة تفاعل المجتمع مع الذكاء الاصطناعي واستخدامه خلال السنوات القليلة المقبلة. وأضافت: "أن أدوات الذكاء الاصطناعي المتخصصة ستستمر في أداء وظائف معينة بكفاءة ضمن مجالاتها المحددة، إلا أن الوكلاء العامين الأقوياء القادرين على التنقل بمرونة بين مختلف أنواع المهام سيبرزون بقوة. هذه الأنظمة ستدمج المهارات المتخصصة ضمن سير عمل أوسع موجه نحو الأهداف، مما سيُعيد تشكيل أنماط الحياة اليومية والممارسات المهنية بطرق جوهرية". لمياء الصديق (أبوظبي)


الوئام
١٦-٠٣-٢٠٢٥
- صحة
- الوئام
كيف ينظر الناس للذكاء الاصطناعي طبيبًا نفسيًا؟
أظهرت دراسة حديثة أن الناس يجدون ردود الذكاء الاصطناعي أكثر تعاطفًا وفهمًا من تلك التي يقدمها خبراء الصحة النفسية، مما يسلط الضوء مجددًا على قدرة الذكاء الاصطناعي على التفوق على البشر في مجالات كانت تُعتبر حكرًا على الخبرة الإنسانية. نُشرت الدراسة في دورية Communications Psychology في 10 يناير، حيث أجرى الباحثون أربع تجارب شارك فيها 550 شخصًا، قارنوا فيها ردود الذكاء الاصطناعي بردود مختصين في الأزمات النفسية من حيث التعاطف والاستجابة والتفضيل العام. تفوق في التفاعل العاطفي كشفت النتائج أن المشاركين اعتبروا ردود الذكاء الاصطناعي أكثر تعاطفًا بنسبة 16% مقارنة بالمختصين، كما فضلوا ردوده بنسبة 68%، حتى بعد معرفة مصدر الردود. وأوضحت المؤلفة الرئيسية للدراسة، داريا أوفسيانيكوفا من جامعة تورونتو، أن نجاح الذكاء الاصطناعي يعود إلى قدرته على التقاط التفاصيل الدقيقة والبقاء موضوعيًا، مما يمنحه ميزة في تقديم تواصل دقيق يُشعر المستخدم بالتعاطف. وفي المقابل، يعاني الخبراء البشريون من الإرهاق والتأثر العاطفي، مما قد يؤثر على جودة استجاباتهم. فرص وتحديات في مجال الرعاية النفسية وعلّقت إلينور واتسون، خبيرة أخلاقيات الذكاء الاصطناعي في معهد IEEE، على الدراسة قائلة: 'الذكاء الاصطناعي قادر على تقديم ردود داعمة بشكل متّسق، وهو ما يصعب على البشر تحقيقه بسبب التحيزات والإرهاق'. وأضافت أن قدرة الذكاء الاصطناعي على معالجة كميات هائلة من البيانات تمنحه ميزة اقتراح زوايا جديدة للعلاج لا يمتلكها المعالج البشري بالضرورة. إمكانية تحسين الوصول إلى الرعاية النفسية تسلّط الدراسة الضوء على إمكانية استخدام الذكاء الاصطناعي لسد الفجوات في خدمات الصحة النفسية عالميًا، حيث تشير بيانات منظمة الصحة العالمية إلى أن ثلثي المصابين باضطرابات نفسية لا يحصلون على العلاج، وترتفع هذه النسبة إلى 85% في الدول ذات الدخل المنخفض والمتوسط. وأكدت واتسون أن سهولة الوصول إلى الذكاء الاصطناعي مقارنة بالمعالجين البشريين قد يجعله أداة قيمة، حيث قالت: 'التكلفة المرتفعة وضيق الوقت يجعل الحصول على استشارة بشرية أمرًا صعبًا، بينما يتيح الذكاء الاصطناعي دعمًا فوريًا.' مخاطر الاعتماد على الذكاء الاصطناعي رغم مزاياه، يحذّر الخبراء من مخاطر ما يُعرف بـ 'التحفيز الفائق'، حيث يصبح المستخدمون مفتونين بردود الذكاء الاصطناعي لدرجة قد تجعلهم يفضلونه على التفاعل البشري الحقيقي. كما تثير هذه التقنيات مخاوف تتعلق بالخصوصية، إذ أن البيانات النفسية للمستخدمين قد تكون عرضة للاختراق أو الاستغلال من قبل جهات غير أخلاقية، ما يستدعي وجود ضوابط صارمة لحماية المعلومات الشخصية وضمان عدم إساءة استخدامها.