logo
الروبوت الخارق يسحق "شات جي بي تي" في التحدي الأصعب

الروبوت الخارق يسحق "شات جي بي تي" في التحدي الأصعب

البيانمنذ 6 ساعات

تتنافس روبوتات الدردشة المعتمدة على الذكاء الاصطناعي في قدرتها على تحليل وتلخيص المستندات والنصوص المختلفة، من العقود القانونية المعقدة إلى الروايات الكاملة، لكن السؤال الأهم يظل: هل تفهم هذه الروبوتات ما تقرأه حقًا؟
للإجابة على هذا التساؤل الجوهري، نُظمت مسابقة فريدة من نوعها لتقييم خمسة من أبرز مساعدي الذكاء الاصطناعي: ChatGPT، Claude، Copilot، Meta AI، وGemini، تم اختبار هذه الروبوتات في قدرتها على فهم أربعة أنواع مختلفة من النصوص: الأدب (رواية "عشيقة ابن آوى")، العلوم الصحية (ورقتان بحثيتان)، القانون (عقدان قانونيان)، والسياسة (خطابان لدونالد ترامب) وفق صحيفة "واشنطن بوست".
لضمان الدقة والموضوعية، تم جمع مجموعة من الخبراء في كل مجال، بما في ذلك المؤلفون الأصليون للنصوص والقضاة المتخصصون، للحكم على إجابات الذكاء الاصطناعي حيث تم طرح إجمالي 115 سؤالاً تفصيلياً، وكشفت النتائج عن تباين كبير، فبعض الإجابات كانت "رائعة بشكل مذهل" بينما كان بعضها الآخر "غبيًا تمامًا". الملاحظة الأكثر إثارة للقلق هي أن جميع الروبوتات، باستثناء واحد، اختلقت معلومات، وهي مشكلة مستمرة تواجه أنظمة الذكاء الاصطناعي.
1. الأدب: ChatGPT يتصدر بصعوبة
كان الأدب هو المجال الأصعب على الروبوتات، ورغم أن ChatGPT، جاء في الصدارة، لكنه لم يقدم ملخصاً مُرضياً تماماً لرواية "عشيقة ابن آوى"، حيث أغفل شخصيتين رئيسيتين ولم يتناول جوانب هامة مثل العبودية والحرب الأهلية. وكان الأسوأ هو Gemini ، حيث قدم ملخصات "غير دقيقة ومضللة". ومع ذلك، أذهلت جودة إجابات ChatGPT وClaude على الأسئلة التحليلية الخبير كريس بوهجاليان، مؤكداً أنهما عبرا عن "كل المشاعر" التي كان يحاول الكاتب نقلها.
2 Claude نجم القوانين
في تقييم فهم عقدين قانونيين شائعين، وجد المحامي ستيرلينغ ميلر "تناقضًا" في أداء الروبوتات، حاولت Meta AI وChatGPT اختصار الأجزاء المعقدة بشكل غير مفيد، وتجاهلتا فروقاً دقيقة مهمة. ChatGPT مثلاً نسي بنداً رئيسياً حول ملكية الاختراعات، تفوق Claude بشكل عام، وقدم أفضل الإجابات وأكثرها شمولاً، خاصةً في اقتراح تعديلات على اتفاقية الإيجار.
-العلوم الصحية: Claude يحصد العلامة الكاملة
أظهرت جميع أدوات الذكاء الاصطناعي أداءً أفضل في تحليل الأبحاث العلمية، وكان Claude هو الأبرز، حيث حصل على درجة 10 من 10 في ملخصه لإحدى الدراسات حول كوفيد الطويل، مقدماً تحليلاً مفيداً ويسلط الضوء على النقاط الهامة للأطباء، يشير الخبراء إلى أن الذكاء الاصطناعي قد يكون لديه وصول واسع للعديد من الأوراق العلمية في بيانات تدريبه، كما أن هذه الأوراق تتبع هيكلاً متوقعًا، مما يسهل معالجتها.
4. السياسة: ChatGPT يتفوق
تم تقييم قدرة الذكاء الاصطناعي على فهم وتحليل خطابات الرئيس دونالد ترامب حيث تميز ChatGPT بإجاباته الرائعة، فمثلاً، على النقيض، واجهت روبوتات أخرى مثل Copilot صعوبة في نقل نبرة ترامب، مما أثر على دقة الملخصات.
تفوق Claude ليصبح الفائز الشامل في المسابقة، وكان الوحيد الذي لم يعاني من الهلوسة والتي يقصد بها (اختلاق المعلومات).
ليس بديلاً
على الرغم من أن Claude وChatGPT قدما تحليلات "مذهلة" في بعض الأحيان لدرجة أدهشت الخبراء، إلا أنه يجب التأكيد على نقطة هامة وهي أنه لم يسجل أي من الروبوتات نسبة أعلى من 70% بشكل عام، وهو ما يشير إلى أن التقنية لا تزال بعيدة عن الكمال.
ويؤكد الخبراء أن الذكاء الاصطناعي ليس بديلاً عن الخبير البشري (مثل المحامي أو الطبيب)، خاصة في الأمور الهامة. ومع ذلك، يمكن أن يكون أداة قيمة للمساعدة في فهم موضوع جديد أو فك رموز المصطلحات.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

تقنية «ذكية» ترصد عيوب الطباعة الثلاثية الأبعاد
تقنية «ذكية» ترصد عيوب الطباعة الثلاثية الأبعاد

صحيفة الخليج

timeمنذ ساعة واحدة

  • صحيفة الخليج

تقنية «ذكية» ترصد عيوب الطباعة الثلاثية الأبعاد

طور باحثون في مختبر «أرغون» الوطني التابع لوزارة الطاقة الأمريكية، بالتعاون مع جامعة فيرجينيا، تقنية جديدة ترصد العيوب الخفية في الأجزاء المعدنية المصنعة بالطباعة الثلاثية الأبعاد، بدقة وسرعة غير مسبوقتين. وقال د. كامل فزاع، من المختبر والباحث الرئيسي في الدراسة: «تعتمد التقنية على دمج الذكاء الاصطناعي مع التصوير الحراري والأشعة السينية، ما يتيح الكشف الفوري عن ما يعرف بـ«مسام ثقب المفتاح»، وهي فراغات دقيقة تتشكل أثناء الطباعة نتيجة اختراق الليزر لعمق مفرط داخل المعدن، مسببة نقاط ضعف خطرة». وأوضح: «تعد هذه العيوب من أبرز التحديات في تصنيع مكونات تستخدم في مجالات حساسة، مثل صناعة الطيران والهندسة الميكانيكية، إذ تتطلب الأجزاء درجة عالية من الصلابة والموثوقية». وأضاف: «يستخدم النظام المطور صوراً حرارية لسطح المعدن تلتقط أثناء الطباعة، ويحللها نموذج ذكاء اصطناعي مدرب سلفاً لاكتشاف مؤشرات تكوّن المسام الداخلية، دون الحاجة لاستخدام الأشعة السينية في كل مرة».

نشاط الرياح وراء الخطوط الغامضة على المريخ
نشاط الرياح وراء الخطوط الغامضة على المريخ

صحيفة الخليج

timeمنذ ساعة واحدة

  • صحيفة الخليج

نشاط الرياح وراء الخطوط الغامضة على المريخ

توصل فريق بحثي من جامعتي براون الأمريكية وبرن السويسرية إلى أن الخطوط الغامضة على منحدرات كوكب المريخ، والتي حيرت العلماء منذ اكتشافها في سبعينات القرن الماضي ليست ناتجة عن تدفقات مياه كما كان يعتقد، بل ترجع في الأغلب إلى نشاط الرياح والغبار. وقال د. أدوماس فالانتيناس، الأستاذ في جامعة براون، والباحث الرئيسي في الدراسة: «إن هذه الخطوط المعروفة علمياً باسم «خطوط المنحدرات المتكررة»، تظهر وتختفي موسمياً، لكن تحليلاً شاملاً لأكثر من 500 ألف خط التقطت صورها عبر مركبة الاستطلاع المدارية التابعة لوكالة الفضاء الأمريكية «ناسا»، لم يظهر أي دلائل تشير إلى وجود ماء سائل أو جليد». وأضاف: «استخدمنا خوارزميات تعلم آلي لإنشاء أول خريطة عالمية لهذه الخطوط، ثم قارنا بعد ذلك مواقع الخطوط بعوامل طبيعية أخرى مثل درجات الحرارة وسرعة الرياح والرطوبة ونشاط الانهيارات الصخرية». وتابع: «ركزنا على فهم العمليات النشطة حالياً على سطح المريخ، ولم نجد أي دليل يؤيد فرضية وجود الماء، ويشير النموذج الأكثر ترجيحاً لدينا إلى أن هذه الخطوط ناتجة عن عمليات جافة، مثل تحرك الغبار بفعل الرياح أو الزلازل أو حتى ارتطام النيازك». وأوضح: «بعض هذه الخطوط القصيرة العمر تظهر بالقرب من فوهات ارتطام حديثة، ما يدعم فرضية أنها نشأت نتيجة موجات صدمية تؤدي إلى انزلاق الغبار على المنحدرات».

الروبوت الخارق يسحق "شات جي بي تي" في التحدي الأصعب
الروبوت الخارق يسحق "شات جي بي تي" في التحدي الأصعب

البيان

timeمنذ 6 ساعات

  • البيان

الروبوت الخارق يسحق "شات جي بي تي" في التحدي الأصعب

تتنافس روبوتات الدردشة المعتمدة على الذكاء الاصطناعي في قدرتها على تحليل وتلخيص المستندات والنصوص المختلفة، من العقود القانونية المعقدة إلى الروايات الكاملة، لكن السؤال الأهم يظل: هل تفهم هذه الروبوتات ما تقرأه حقًا؟ للإجابة على هذا التساؤل الجوهري، نُظمت مسابقة فريدة من نوعها لتقييم خمسة من أبرز مساعدي الذكاء الاصطناعي: ChatGPT، Claude، Copilot، Meta AI، وGemini، تم اختبار هذه الروبوتات في قدرتها على فهم أربعة أنواع مختلفة من النصوص: الأدب (رواية "عشيقة ابن آوى")، العلوم الصحية (ورقتان بحثيتان)، القانون (عقدان قانونيان)، والسياسة (خطابان لدونالد ترامب) وفق صحيفة "واشنطن بوست". لضمان الدقة والموضوعية، تم جمع مجموعة من الخبراء في كل مجال، بما في ذلك المؤلفون الأصليون للنصوص والقضاة المتخصصون، للحكم على إجابات الذكاء الاصطناعي حيث تم طرح إجمالي 115 سؤالاً تفصيلياً، وكشفت النتائج عن تباين كبير، فبعض الإجابات كانت "رائعة بشكل مذهل" بينما كان بعضها الآخر "غبيًا تمامًا". الملاحظة الأكثر إثارة للقلق هي أن جميع الروبوتات، باستثناء واحد، اختلقت معلومات، وهي مشكلة مستمرة تواجه أنظمة الذكاء الاصطناعي. 1. الأدب: ChatGPT يتصدر بصعوبة كان الأدب هو المجال الأصعب على الروبوتات، ورغم أن ChatGPT، جاء في الصدارة، لكنه لم يقدم ملخصاً مُرضياً تماماً لرواية "عشيقة ابن آوى"، حيث أغفل شخصيتين رئيسيتين ولم يتناول جوانب هامة مثل العبودية والحرب الأهلية. وكان الأسوأ هو Gemini ، حيث قدم ملخصات "غير دقيقة ومضللة". ومع ذلك، أذهلت جودة إجابات ChatGPT وClaude على الأسئلة التحليلية الخبير كريس بوهجاليان، مؤكداً أنهما عبرا عن "كل المشاعر" التي كان يحاول الكاتب نقلها. 2 Claude نجم القوانين في تقييم فهم عقدين قانونيين شائعين، وجد المحامي ستيرلينغ ميلر "تناقضًا" في أداء الروبوتات، حاولت Meta AI وChatGPT اختصار الأجزاء المعقدة بشكل غير مفيد، وتجاهلتا فروقاً دقيقة مهمة. ChatGPT مثلاً نسي بنداً رئيسياً حول ملكية الاختراعات، تفوق Claude بشكل عام، وقدم أفضل الإجابات وأكثرها شمولاً، خاصةً في اقتراح تعديلات على اتفاقية الإيجار. -العلوم الصحية: Claude يحصد العلامة الكاملة أظهرت جميع أدوات الذكاء الاصطناعي أداءً أفضل في تحليل الأبحاث العلمية، وكان Claude هو الأبرز، حيث حصل على درجة 10 من 10 في ملخصه لإحدى الدراسات حول كوفيد الطويل، مقدماً تحليلاً مفيداً ويسلط الضوء على النقاط الهامة للأطباء، يشير الخبراء إلى أن الذكاء الاصطناعي قد يكون لديه وصول واسع للعديد من الأوراق العلمية في بيانات تدريبه، كما أن هذه الأوراق تتبع هيكلاً متوقعًا، مما يسهل معالجتها. 4. السياسة: ChatGPT يتفوق تم تقييم قدرة الذكاء الاصطناعي على فهم وتحليل خطابات الرئيس دونالد ترامب حيث تميز ChatGPT بإجاباته الرائعة، فمثلاً، على النقيض، واجهت روبوتات أخرى مثل Copilot صعوبة في نقل نبرة ترامب، مما أثر على دقة الملخصات. تفوق Claude ليصبح الفائز الشامل في المسابقة، وكان الوحيد الذي لم يعاني من الهلوسة والتي يقصد بها (اختلاق المعلومات). ليس بديلاً على الرغم من أن Claude وChatGPT قدما تحليلات "مذهلة" في بعض الأحيان لدرجة أدهشت الخبراء، إلا أنه يجب التأكيد على نقطة هامة وهي أنه لم يسجل أي من الروبوتات نسبة أعلى من 70% بشكل عام، وهو ما يشير إلى أن التقنية لا تزال بعيدة عن الكمال. ويؤكد الخبراء أن الذكاء الاصطناعي ليس بديلاً عن الخبير البشري (مثل المحامي أو الطبيب)، خاصة في الأمور الهامة. ومع ذلك، يمكن أن يكون أداة قيمة للمساعدة في فهم موضوع جديد أو فك رموز المصطلحات.

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store