
الذكاء الاصطناعي يفشل في المهام المالية اليومية.. ما القصة؟
منذ ظهور " شات جي بي تي" في نهاية عام 2022 ومطلع العام الذي يليه، تعالت الأصوات من مختلف بقاع العالم في مختلف الوظائف خوفًا من استيلاء هذه التقنية على الوظائف في العالم، وهي الأصوات التي لم تثن الشركات عن تطوير هذه النماذج بشكل أكثر وأقوى في مسعى منها لزيادة قدراتها.
ومن أجل قياس هذه القدرات، تقوم الشركات باختبارات مستمرة، وهي الاختبارات التي تنجح فيها نماذج الذكاء الاصطناعي بشكل باهر، ولكن هذه النجاحات كانت سببًا لإثارة شكوك ريان كريشنان الذي قرر لاحقًا تأسيس شركة وأطلق عليها "فالس إيه آي" (Vals AI).
تسعى "فالس إيه آي" لاختبار نماذج الذكاء الاصطناعي بشكل مستقل وبعيد عن الشركات، وذلك عبر مجموعة من الاختبارات المكثفة للتيقن من جودة هذه النماذج واكتشاف نقاط الضعف فيها. وبحسب الاختبارات التي أجرتها "فالس إيه آي" على 22 نموذجا عاما للذكاء الاصطناعي من " أوبن إيه آي" و" غوغل" وآنثروبيك" و" إكس" وغيرها، فإن جميع هذه النماذج سجلت أقل من 50% في اختبارات الدقة المتعلقة بالتحليل والجوانب المالية المتنوعة، وتجدر الإشارة إلى أن هذه الاختبارات لم تكن اختبارات معقدة، بل كانت لمهام مالية بسيطة، فكيف حدث هذا؟
فجوة بين قاعدة معلومات التدريب والاستخدامات الحقيقية
يرى كريشنان أن الادعاءات المتعلقة بجودة نماذج الذكاء الاصطناعي ودقتها تفتقر بشكل كبير إلى الدقة، وذلك لأنها تأتي مباشرة من الشركة المطورة للنموذج مع غياب أدوات المراجعة والتقييم الخارجية، لذا كان يجب إيجاد حل خارجي لتقييم نماذج الذكاء الاصطناعي المختلفة وأدواتها.
وفي حديثه مع صحيفة "واشنطن بوست"، أشار كيرشنان إلى أن معظم نماذج الذكاء الاصطناعي تُدرّب على أبحاث علمية وأوراق بحثية بحتة، وهي في أغلب الأحيان لا تمتّ إلى الواقع والاستخدامات اليومية بصلة، ولذلك أحيانًا تكون النتائج جيدة علميا ولكنها سيئة عمليا.
دفع هذا "فالس إيه آي" إلى تطوير اختبار ذكاء اصطناعي مكون من 500 سؤال بمساعدة إحدى المؤسسات المالية الرائدة من أجل بناء اختبار فعال في القطاع المالي تحديدًا، وتحديد مستوى جودة نماذج الذكاء الاصطناعي ودقتها.
وأضاف أيضًا أن معظم اختبارات الذكاء الاصطناعي تتم عبر مجموعة من الأسئلة العامة والبيانات العلمية الواردة في الأوراق البحثية، وهي بيانات متوفرة لأغلب نماذج الذكاء الاصطناعي في العالم ويمكن الوصول إليها بسهولة كبيرة، وهو ما يجعل نتائج الاختبارات إيجابية دومًا.
وعن الاختبار الذي أجرته "فالس إيه آي"، قال كريشنان إن الاختبار تضمن مجموعة من المهام المتنوعة والأساسية لكل من يعمل في أسواق المال وحتى الصحفيين الذين يغطون عالم المال بشكل مستمر حتى أصبحت لديهم خبرة كافية. شمل الاختبار أسئلة مثل البحث عن معلومات داخل أنظمة "إدغار" (EDGAR) لتخزين البيانات في الشركات، أو حتى قاعدة بيانات هيئة الأوراق المالية والبورصات المتاحة للعامة والتي تحتوي على ملفات الشركات، وهي جميعًا موارد يستخدمها المحللون والخبراء ويحتاجون إليها بشكل يومي.
أقل من 50% لجميع النماذج
بحسب تقرير "واشنطن بوست"، فإن اختبار "فالس إيه آي" أثمر عن نتائج متدنية لنماذج الذكاء الاصطناعي التي لم تتخطّ نتائجها معًا 50% من إجمالي النتائج في الاختبار. فمثلًا، تمكن نموذج "أوبن إيه آي أو 3" الأحدث من الشركة من تحقيق نتيجة 48.3% رغم كونه مخصصًا لهذا النوع من الأبحاث والمعلومات.
إعلان
ومن ناحية نموذج "آثنروبيك" الأحدث "كلود سونيت 3.7" (Claude Sonnet 3.7)، فقد تمكن النموذج من تحقيق نسبة 44.1%. وأما نماذج "ميتا" الثلاثة "إل إل إم إيه" (LLMA)، فقد كانت نتائجها مخيبة للآمال بشكل كبير، إذ لم تتجاوز نتائجها 10% في الاختبارات جميعها.
بالطبع، تجاهلت هذه الشركات اختبارات "فالس إيه آي" ورفضت التعليق عليها تمامًا، وذلك سواء كان من قبل "أوبن إيه آي" أو غيرها من الشركات التي تجاهلت نتائج الاختبارات بالكامل.
لماذا هذه النتائج السيئة؟
توجد العديد من الأسباب المنطقية التي تجعل نتائج الذكاء الاصطناعي سيئة إلى هذه الدرجة، بدءًا من اعتماد الذكاء الاصطناعي على مجموعة من المواد غير الدقيقة في الاختبارات وحتى المواد العلمية البحتة التي لا تتطرق إلى الأسئلة الحقيقية التي يحتاجها الخبراء.
وعلى النقيض، فإن الشركة اعتمدت على الخبراء لبناء مكتبة الأسئلة الخاصة بها، وذلك من دون تزويد النموذج بالمستندات والتدريب اللازم للوصول إلى هذه النتائج، إذ وُجّهت الأسئلة مباشرة إلى النماذج من دون تقديم سياق حقيقي لها.
صيحة جديدة في عالم الذكاء الاصطناعي
تعد شركة "فالس إيه آي" من الشركات الناشئة الجديدة في قطاع الذكاء الاصطناعي والتي تسعى للتيقن والتأكد من نتائج اختبارات النماذج المختلفة وتدقيق النماذج، وذلك كاستجابة مباشرة لتنوع نماذج الذكاء الاصطناعي وطرح العديد منها باستمرار.
ويرى كريشنان أن الاعتماد على اختبارات الشركات الخارجية مثل "فالس إيه آي" هو الطريق الوحيد لتطوير نماذج الذكاء الاصطناعي وبناء روبوتات دردشة حقيقية قادرة على مساعدة المستخدمين في التحديات الحقيقية التي يواجهونها.
وفي هذه الحالة، فإن الذكاء الاصطناعي لن يأخذ مكان البشر بل سيكون أداة لتيسير أداء العمل والانتهاء منه في وقت سريع وقياسي، شريطة أن تكون النتائج دقيقة ويمكن أن يعتمد عليها الخبراء.
في فبراير/شباط الماضي، قال بيل غيتس مؤسس "مايكروسوفت" إن الذكاء الاصطناعي سيأخذ مكان العديد من الوظائف البشرية مثل الأطباء والمعلمين، وهو الأمر الذي أيده فيكتور لازارتي المستثمر الأبرز في العديد من الشركات التقنية، إذ قال إن دور الذكاء الاصطناعي لن يقتصر على تعزيز المهام البشرية فقط.
ولكن ما مدى صحة هذه النظريات والتصريحات في ضوء نتائج اختبارات "فالس إيه آي" التي أثبتت قصر قدرات الذكاء الاصطناعي في بعض المجالات؟
هاشتاغز

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الجزيرة
منذ 2 ساعات
- الجزيرة
انقطاع "إكس".. هجوم من القراصنة أم عطل تقني؟
توقفت منصة "إكس" (X) المملوكة لرجل الأعمال إيلون ماسك عن العمل بالأمس بشكل مفاجئ لعدة ساعات، وذلك في مختلف الدول حول العالم ودون وجود سبب واضح في وقتها، وهو الأمر الذي دفع مجموعات القراصنة للادعاء أنها السبب وراء هذا الانقطاع. دام الانقطاع لعدة ساعات حاولت فيها فرق الدعم الفني إعادة المنصة للعمل، وذلك بعد مرور الأزمة التي تسببت في الانقطاع، وهي بحسب ما نشره موقع "وايرد" (Wired) نقلًا عن المتحدث باسم إدارة الإطفاء والإنقاذ في هيلسبورو، بيسيث بيتش ومصادر سرية رفضت الكشف عن نفسها. إذ أوضح بيتش أن إشارة الاستغاثة وصلت إلى الإدارة بوجود حريق في منطقة هيلسبورو للتكنولوجيا التي تضم مقرات ومراكز بيانات لأكثر من شركة عالمية، وعند الوصول إلى موقع الحريق، تبين أن السبب في هذا الحريق هو غرفة تضم عددًا كبيرًا من البطاريات، وأضاف بيتش أن الغرفة كانت مليئة بالدخان بشكل يصعب معه الرؤية، إذ استمر فريق الإطفاء في عمله لمدة جاوزت 6 ساعات. ولكن، لم ينتشر هذا الحريق إلى باقي غرف المبنى التي تضم إحدى مراكز البيانات التابعة لمنصة "إكس" (X)، وبحسب تقرير الصحيفة، فقد رفضت منصة "إكس" التعليق على هذه الحادثة في الوقت الحالي لكونها تجري مجموعة من التحقيقات حول الأمر. إعلان تجدر الإشارة إلى أن "إكس" كانت تعتمد على 3 مراكز بيانات ضخمة قبل أن يستحوذ عليها إيلون ماسك، وبعد الاستحواذ قام ماسك بالتخلي عن مركز البيانات الموجود في ساكرامنتو من أجل خفض التكاليف. ولا تعد هذه المرة الأولى التي يتوقف فيها "إكس" عن العمل بشكل كامل، إذ حدث الأمر في مارس/آذار الماضي، وحينها وجه إيلون ماسك اللوم رسميًا إلى مجموعات القراصنة التي قامت باختراق المنصة وتعطيلها عن العمل، ولكن هذه المرة، لم يعلق ماسك على الأمر تمامًا. في الوقت الحالي تعمل المنصة بشكل جيد، إذ استعادت أغلب خدماتها التي تأثرت بسبب الانقطاع، وذلك رغم أن خدمات المنصة عادت للعمل وتوقفت أكثر من مرة منذ بداية الأزمة، ولكن الآن يبدو أن جميع الخدمات أصبحت تعمل بشكل جيد.


الجزيرة
منذ 3 ساعات
- الجزيرة
الاستثمار بدل العقوبات.. هل يمكن أن يشكل برنامج إيران النووي فرصة لأميركا؟
ظهرت فكرة جريئة أثناء المفاوضات النووية الأميركية الإيرانية الجارية: ماذا لو لم تحاول الولايات المتحدة احتواء البرنامج النووي الإيراني فحسب، بل ساعدت في بنائه أيضا؟ وقالت الكاتبة فينا علي خان -في تقرير نشرته مجلة "فورين بوليسي" الأميركية- إن هذه الفكرة تستهدف مباشرة غريزة الرئيس الأميركي دونالد ترامب في عقد الصفقات، والتي تجلت بوضوح خلال زيارته الأخيرة إلى الشرق الأوسط. وفي مقال رأي كتبه وزير الخارجية الإيراني عباس عراقجي بصحيفة واشنطن بوست في أبريل/نيسان الماضي قال إن اتفاقا نوويا جديدا قد يفتح الباب أمام الشركات الأميركية للاستفادة مما وصفها بفرصة اقتصادية بقيمة "تريليون دولار" في بلد يضم أحد أكبر احتياطيات النفط والغاز في العالم. كما نشر عراقجي نص خطاب كان قد أعده لإلقائه في مؤسسة كارنيغي للسلام الدولي (قبل أن تلغى الفعالية) استعرض فيه خطط إيران لبناء ما لا يقل عن 19 مفاعلا نوويا جديدا، وطرح فكرة الاستثمار الأميركي، مشيرا إلى أن السوق المحلية الإيرانية قد تسهم في "إنعاش الصناعة النووية المتعثرة في الولايات المتحدة". هذا العرض لم يكن مجرد غصن زيتون دبلوماسي، بل كان نداء محسوبا يتماشى مع أسلوب ترامب التفاوضي المفضل القائم على المعاملات والمخاطرة العالية والعناوين اللافتة. وقد قدّم العرض فرصة لواشنطن لخلق وظائف وآليات تحقق صارمة مقابل تخفيف العقوبات ومنح طهران حق الوصول إلى التكنولوجيا، في محاولة من إيران لتحويل المواجهة الممتدة منذ عقود إلى تعاون اقتصادي متبادل. أصل اقتصادي وأشارت الكاتبة إلى أن الرسالة الأساسية التي وجهها عراقجي إلى ترامب كانت إستراتيجية، حيث أعاد تأطير البرنامج النووي الإيراني ليس كتهديد أمني، بل كأصل اقتصادي، فترامب يستجيب للأرقام الكبيرة والصفقات الكبرى، والفكرة هي أنه إذا وُعِد بوظائف للأميركيين واتفاق يترك إرثا تاريخيا فقد يكون أكثر قبولا لتنفيذ هذه الصفقة. لكن هذا الاقتراح -حسب الكاتبة- ليس حديث العهد تماما، إذ سبق أن أجريت مناقشات مماثلة خلال مفاوضات الاتفاق النووي في عام 2015 (المعروف بخطة العمل الشاملة المشتركة) الذي انسحب منه ترامب عام 2018. ومن خلال التلويح مجددا بفرصة اقتصادية مرتبطة بالاستثمار في قطاعها النووي تختبر طهران مدى قدرة الإدارة الأميركية على تحمّل المخاطر السياسية في وقت يعيد فيه ترامب صياغة قواعد الدبلوماسية، على أمل أن ينظر بخلاف أسلافه إلى المحادثات النووية من زاوية المكاسب المتبادلة. ومن منظور تاريخي، ليست هذه الفكرة مستبعدة تماما، ذلك أن الصناعة النووية الإيرانية نشأت بدعم أميركي، ففي عام 1957 وتحت مظلة برنامج الرئيس دوايت آيزنهاور"الذرة من أجل السلام" -وهي مبادرة ضمن سياق الحرب الباردة تهدف إلى تعزيز الاستخدام السلمي للطاقة النووية في الدول الحليفة- ساعدت الولايات المتحدة طهران على إطلاق أول برنامج نووي لها. وبعد عقد من الزمن أنشأت واشنطن مفاعلا بحثيا بقدرة 5 ميغاواطات داخل حرم جامعة طهران لا يزال يعمل حتى اليوم، وقد زودت إيران بيورانيوم عالي التخصيب لتشغيله. تخوف روسيا والصين جزئيا، يرجع الدافع الحالي لإيران نحو التعاون الاقتصادي مع الغرب إلى إحباطها من محدودية المكاسب التي حققتها عبر "التوجه شرقا"، فقد علقت طهران آمالا كبيرة على تعزيز علاقاتها المتعمقة مع الصين وروسيا لدعم قدرتها على مواجهة العقوبات الأميركية، وتطوير ما تسميه "اقتصاد المقاومة" المبني على الاعتماد الذاتي. لكن هذه الرؤية لم تتحقق كما كان مأمولا، إذ لا تزال العقوبات تخنق التجارة وتثني المستثمرين وتعرقل مشاريع الشراكة. وتعتبر روسيا الشريك النووي الأكثر استقرارا لإيران، حيث توفر شركة "روس آتوم" الوقود والدعم الفني لمحطة بوشهر، وتعمل على بناء وحدتين إضافيتين تحت إشراف دولي، لكن الشركة الروسية تتوخى الحذر في توسيع التعاون النووي لتفادي العقوبات الأميركية الثانوية التي قد تهدد مشاريعها العالمية. وأشارت الكاتبة إلى أن الصين قلصت تعاونها النووي مع إيران -خصوصا في مجالات التخصيب وإعادة المعالجة- نتيجة الضغوط الأميركية، مما دفع شركات مثل المؤسسة الوطنية النووية الصينية إلى التردد في التوسع. وحسب ما يوضحه عباس عراقجي، فإن هدف إيران لا يقتصر على جذب استثمارات ضخمة فورا، بل يشمل رفع العقوبات واكتساب المعرفة والاندماج مجددا في الاقتصاد العالمي. ويعتقد صانعو القرار الإيرانيون أن دخول الشركات الأميركية السوق النووية الإيرانية سيحفز الأوروبيين والآسيويين على اللحاق بها. انتقادات أميركية لكن هذه الرؤية تواجه انتقادات داخلية من المتشددين وبعض الوسطية الذين يرون في الانفتاح على الغرب خيارا ساذجا في ظل العقوبات المستمرة والفساد وغياب بيئة تنظيمية مستقرة. ويرى بعض المسؤولين الإيرانيين أن عهد ترامب يوفر فرصة نادرة يجب استغلالها، ولا سيما مع وجود كبير مفاوضيه ستيف ويتكوف الذي يفتقر إلى خبرة سابقيه. ويعتقد عباس عراقجي أن عروضا بعقود بمليارات الدولارات قد تغري الفريق الأميركي. وقالت الكاتبة إن طهران تعتبر برنامجها النووي اليوم أداة ردع حيوية في ظل تراجع " محور المقاومة"، في حين يعارض الجمهوريون -بمن فيهم ترامب- استمرار تخصيب اليورانيوم. لكن محللين مثل ريتشارد نيفيو يرون أن إيران تستغل قلة خبرة الفريق الأميركي وتغريه بصفقة "براقة" قد تجذب ترامب رغم المخاطر التي تنطوي عليها. من جهتها، لم تحدد إيران التنازلات المحتملة بشأن أجهزة الطرد المركزي في أي اتفاق نووي، ومن غير المرجح أن تسمح بدخول خبراء أميركيين إلى منشآت حساسة مثل منشأة نطنز النووية بسبب مخاوف التجسس، وترفض تفكيك بنيتها التحتية للتخصيب، حيث تحتفظ بعدد كافٍ من أجهزة الطرد المركزي لإنتاج مواد انشطارية عسكرية. وتعتمد طهران في طرحها على خلق زخم سياسي عبر التعاون التجاري لمنع انسحاب واشنطن من الاتفاق. إعلان ووفقا لنيفيو، فإن إيران مستعدة لشراكة مالية، لكنها ترفض شراكة تقنية تتيح دخول الأميركيين إلى منشآتها النووية. وأضافت الكاتبة أن الجانب الأميركي يواجه عقبات ضخمة أمام أي محاولة تعاون اقتصادي، أبرزها عزل النظام المصرفي الإيراني بسبب إدراجه في القائمة السوداء لمجموعة العمل المالي، إضافة إلى سوء الإدارة والفساد والعقوبات المتراكمة، مما يجعل الشركات الأجنبية تواجه مخاطر قانونية ومخاطر سمعة وعقوبات أميركية مستمرة. كما يواجه البيت الأبيض معارضة قوية من الكونغرس الجمهوري الذي يرفض شرعية التخصيب النووي الإيراني ويدين فكرة دعم منشآت مثل نطنز بأموال أميركية، مما قد يقضي على أي مقترح في مهده. في المقابل، هناك مقترح أكثر توازنا قدمه دبلوماسيون إيرانيون لإنشاء تحالف إقليمي لتخصيب اليورانيوم يشمل السعودية ودولا خليجية أخرى، لكن الرياض تفضل تطوير برنامجها النووي بدعم أميركي مباشر. ويشير الخبير الاقتصادي إسفنديار باتمانغليج إلى أن البنية التحتية الإيرانية قد تؤهلها للمساهمة في سلسلة إمداد نووية خليجية مستقبلية تغذي مفاعلات المنطقة، بما فيها السعودية، لكن تحقيق ذلك يتطلب إرادة سياسية مشتركة. وتعي طهران ضعف فرص دخول الشركات الأميركية إلى برنامجها النووي، لكنها تأمل أن يعيد مجرد طرح الفكرة تحريك الحوار ويجذب اهتمام ترامب عبر المصالح الاقتصادية.


الجزيرة
منذ 5 ساعات
- الجزيرة
مركبات كيميائية جديدة تستهدف الطفيلي المسبب للملاريا في البعوض
ذكر باحثون في دورية (نيتشر) العلمية أن الناموسيات قد تصبح مفيدة من جديد في مكافحة الملاريا في المناطق الموبوءة، وذلك باستخدام مادة كيميائية تستهدف الطفيلي المسبب للملاريا في البعوض بدلا من البعوض نفسه. وأدى استخدام المبيدات الحشرية طويلة المفعول في الناموسيات إلى انخفاض كبير في الإصابة بالملاريا والوفيات الناجمة عنها بين عامي 2000 و2015، إلا أن هذه الطريقة أصبحت في نهاية المطاف أقل فعالية بسبب تزايد مقاومة المبيدات الحشرية. وفحص باحثون من كلية هارفارد تي. إتش. تشان للصحة العامة في بوسطن 81 مركبا كيميائيا تجريبيا مضادا للملاريا، وحددوا اثنين منها يمنعان نمو طفيلي الملاريا من خلال استهداف بروتين رئيسي في الطفيلي. وكانت هذه المركبات فعالة حتى ضد البعوض المقاوم للمبيدات الحشرية التقليدية. وقالت فلامينيا كاتيروتشا المشاركة في إعداد الدراسة في بيان "مكافحة الملاريا بحاجة ماسة إلى الابتكار". وقالت ألكسندرا بروبست، المعدة الرئيسية للدراسة في بيان "تمكن زملاؤنا في مجال الكيمياء بجامعة أوريجون للصحة والعلوم من إنتاج هذه المركبات بتكلفة زهيدة، وهو ما يسمح بدمج هذا النهج في البنية الأساسية الحالية للناموسيات بتكلفة تنافسية".