logo
روبوت ذكاء اصطناعي يتفوق على "شات جي بي تي" في أصعب اختبارات القراءة

روبوت ذكاء اصطناعي يتفوق على "شات جي بي تي" في أصعب اختبارات القراءة

البيانمنذ 4 ساعات

تتنافس روبوتات الدردشة المعتمدة على الذكاء الاصطناعي في قدرتها على تحليل وتلخيص المستندات والنصوص المختلفة، من العقود القانونية المعقدة إلى الروايات الكاملة، لكن السؤال الأهم يظل: هل تفهم هذه الروبوتات ما تقرأه حقًا؟
للإجابة على هذا التساؤل الجوهري، نُظمت مسابقة فريدة من نوعها لتقييم خمسة من أبرز مساعدي الذكاء الاصطناعي: ChatGPT، Claude، Copilot، Meta AI، وGemini، تم اختبار هذه الروبوتات في قدرتها على فهم أربعة أنواع مختلفة من النصوص: الأدب (رواية "عشيقة ابن آوى")، العلوم الصحية (ورقتان بحثيتان)، القانون (عقدان قانونيان)، والسياسة (خطابان لدونالد ترامب) وفق صحيفة "واشنطن بوست".
لضمان الدقة والموضوعية، تم جمع مجموعة من الخبراء في كل مجال، بما في ذلك المؤلفون الأصليون للنصوص والقضاة المتخصصون، للحكم على إجابات الذكاء الاصطناعي حيث تم طرح إجمالي 115 سؤالاً تفصيلياً، وكشفت النتائج عن تباين كبير، فبعض الإجابات كانت "رائعة بشكل مذهل" بينما كان بعضها الآخر "غبيًا تمامًا". الملاحظة الأكثر إثارة للقلق هي أن جميع الروبوتات، باستثناء واحد، اختلقت معلومات، وهي مشكلة مستمرة تواجه أنظمة الذكاء الاصطناعي.
1. الأدب: ChatGPT يتصدر بصعوبة
كان الأدب هو المجال الأصعب على الروبوتات، ورغم أن ChatGPT، جاء في الصدارة، لكنه لم يقدم ملخصاً مُرضياً تماماً لرواية "عشيقة ابن آوى"، حيث أغفل شخصيتين رئيسيتين ولم يتناول جوانب هامة مثل العبودية والحرب الأهلية. وكان الأسوأ هو Gemini ، حيث قدم ملخصات "غير دقيقة ومضللة". ومع ذلك، أذهلت جودة إجابات ChatGPT وClaude على الأسئلة التحليلية الخبير كريس بوهجاليان، مؤكداً أنهما عبرا عن "كل المشاعر" التي كان يحاول الكاتب نقلها.
2 Claude نجم القوانين
في تقييم فهم عقدين قانونيين شائعين، وجد المحامي ستيرلينغ ميلر "تناقضًا" في أداء الروبوتات، حاولت Meta AI وChatGPT اختصار الأجزاء المعقدة بشكل غير مفيد، وتجاهلتا فروقاً دقيقة مهمة. ChatGPT مثلاً نسي بنداً رئيسياً حول ملكية الاختراعات، تفوق Claude بشكل عام، وقدم أفضل الإجابات وأكثرها شمولاً، خاصةً في اقتراح تعديلات على اتفاقية الإيجار.
-العلوم الصحية: Claude يحصد العلامة الكاملة
أظهرت جميع أدوات الذكاء الاصطناعي أداءً أفضل في تحليل الأبحاث العلمية، وكان Claude هو الأبرز، حيث حصل على درجة 10 من 10 في ملخصه لإحدى الدراسات حول كوفيد الطويل، مقدماً تحليلاً مفيداً ويسلط الضوء على النقاط الهامة للأطباء، يشير الخبراء إلى أن الذكاء الاصطناعي قد يكون لديه وصول واسع للعديد من الأوراق العلمية في بيانات تدريبه، كما أن هذه الأوراق تتبع هيكلاً متوقعًا، مما يسهل معالجتها.
4. السياسة: ChatGPT يتفوق
تم تقييم قدرة الذكاء الاصطناعي على فهم وتحليل خطابات الرئيس دونالد ترامب حيث تميز ChatGPT بإجاباته الرائعة، فمثلاً، على النقيض، واجهت روبوتات أخرى مثل Copilot صعوبة في نقل نبرة ترامب، مما أثر على دقة الملخصات.
تفوق Claude ليصبح الفائز الشامل في المسابقة، وكان الوحيد الذي لم يعاني من الهلوسة والتي يقصد بها (اختلاق المعلومات).
ليس بديلاً
على الرغم من أن Claude وChatGPT قدما تحليلات "مذهلة" في بعض الأحيان لدرجة أدهشت الخبراء، إلا أنه يجب التأكيد على نقطة هامة وهي أنه لم يسجل أي من الروبوتات نسبة أعلى من 70% بشكل عام، وهو ما يشير إلى أن التقنية لا تزال بعيدة عن الكمال.
ويؤكد الخبراء أن الذكاء الاصطناعي ليس بديلاً عن الخبير البشري (مثل المحامي أو الطبيب)، خاصة في الأمور الهامة. ومع ذلك، يمكن أن يكون أداة قيمة للمساعدة في فهم موضوع جديد أو فك رموز المصطلحات.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

روبوت ذكاء اصطناعي يتفوق على "شات جي بي تي" في أصعب اختبارات القراءة
روبوت ذكاء اصطناعي يتفوق على "شات جي بي تي" في أصعب اختبارات القراءة

البيان

timeمنذ 4 ساعات

  • البيان

روبوت ذكاء اصطناعي يتفوق على "شات جي بي تي" في أصعب اختبارات القراءة

تتنافس روبوتات الدردشة المعتمدة على الذكاء الاصطناعي في قدرتها على تحليل وتلخيص المستندات والنصوص المختلفة، من العقود القانونية المعقدة إلى الروايات الكاملة، لكن السؤال الأهم يظل: هل تفهم هذه الروبوتات ما تقرأه حقًا؟ للإجابة على هذا التساؤل الجوهري، نُظمت مسابقة فريدة من نوعها لتقييم خمسة من أبرز مساعدي الذكاء الاصطناعي: ChatGPT، Claude، Copilot، Meta AI، وGemini، تم اختبار هذه الروبوتات في قدرتها على فهم أربعة أنواع مختلفة من النصوص: الأدب (رواية "عشيقة ابن آوى")، العلوم الصحية (ورقتان بحثيتان)، القانون (عقدان قانونيان)، والسياسة (خطابان لدونالد ترامب) وفق صحيفة "واشنطن بوست". لضمان الدقة والموضوعية، تم جمع مجموعة من الخبراء في كل مجال، بما في ذلك المؤلفون الأصليون للنصوص والقضاة المتخصصون، للحكم على إجابات الذكاء الاصطناعي حيث تم طرح إجمالي 115 سؤالاً تفصيلياً، وكشفت النتائج عن تباين كبير، فبعض الإجابات كانت "رائعة بشكل مذهل" بينما كان بعضها الآخر "غبيًا تمامًا". الملاحظة الأكثر إثارة للقلق هي أن جميع الروبوتات، باستثناء واحد، اختلقت معلومات، وهي مشكلة مستمرة تواجه أنظمة الذكاء الاصطناعي. 1. الأدب: ChatGPT يتصدر بصعوبة كان الأدب هو المجال الأصعب على الروبوتات، ورغم أن ChatGPT، جاء في الصدارة، لكنه لم يقدم ملخصاً مُرضياً تماماً لرواية "عشيقة ابن آوى"، حيث أغفل شخصيتين رئيسيتين ولم يتناول جوانب هامة مثل العبودية والحرب الأهلية. وكان الأسوأ هو Gemini ، حيث قدم ملخصات "غير دقيقة ومضللة". ومع ذلك، أذهلت جودة إجابات ChatGPT وClaude على الأسئلة التحليلية الخبير كريس بوهجاليان، مؤكداً أنهما عبرا عن "كل المشاعر" التي كان يحاول الكاتب نقلها. 2 Claude نجم القوانين في تقييم فهم عقدين قانونيين شائعين، وجد المحامي ستيرلينغ ميلر "تناقضًا" في أداء الروبوتات، حاولت Meta AI وChatGPT اختصار الأجزاء المعقدة بشكل غير مفيد، وتجاهلتا فروقاً دقيقة مهمة. ChatGPT مثلاً نسي بنداً رئيسياً حول ملكية الاختراعات، تفوق Claude بشكل عام، وقدم أفضل الإجابات وأكثرها شمولاً، خاصةً في اقتراح تعديلات على اتفاقية الإيجار. -العلوم الصحية: Claude يحصد العلامة الكاملة أظهرت جميع أدوات الذكاء الاصطناعي أداءً أفضل في تحليل الأبحاث العلمية، وكان Claude هو الأبرز، حيث حصل على درجة 10 من 10 في ملخصه لإحدى الدراسات حول كوفيد الطويل، مقدماً تحليلاً مفيداً ويسلط الضوء على النقاط الهامة للأطباء، يشير الخبراء إلى أن الذكاء الاصطناعي قد يكون لديه وصول واسع للعديد من الأوراق العلمية في بيانات تدريبه، كما أن هذه الأوراق تتبع هيكلاً متوقعًا، مما يسهل معالجتها. 4. السياسة: ChatGPT يتفوق تم تقييم قدرة الذكاء الاصطناعي على فهم وتحليل خطابات الرئيس دونالد ترامب حيث تميز ChatGPT بإجاباته الرائعة، فمثلاً، على النقيض، واجهت روبوتات أخرى مثل Copilot صعوبة في نقل نبرة ترامب، مما أثر على دقة الملخصات. تفوق Claude ليصبح الفائز الشامل في المسابقة، وكان الوحيد الذي لم يعاني من الهلوسة والتي يقصد بها (اختلاق المعلومات). ليس بديلاً على الرغم من أن Claude وChatGPT قدما تحليلات "مذهلة" في بعض الأحيان لدرجة أدهشت الخبراء، إلا أنه يجب التأكيد على نقطة هامة وهي أنه لم يسجل أي من الروبوتات نسبة أعلى من 70% بشكل عام، وهو ما يشير إلى أن التقنية لا تزال بعيدة عن الكمال. ويؤكد الخبراء أن الذكاء الاصطناعي ليس بديلاً عن الخبير البشري (مثل المحامي أو الطبيب)، خاصة في الأمور الهامة. ومع ذلك، يمكن أن يكون أداة قيمة للمساعدة في فهم موضوع جديد أو فك رموز المصطلحات.

أول رد من الزمالك على انتقال "زيزو" إلى الأهلي
أول رد من الزمالك على انتقال "زيزو" إلى الأهلي

سكاي نيوز عربية

timeمنذ يوم واحد

  • سكاي نيوز عربية

أول رد من الزمالك على انتقال "زيزو" إلى الأهلي

ونشرت الصفحة فيديو لشيكابالا وهو يحتفل مع الجماهير بكأس مصر التي أحرزها الزمالك على حساب بيراميدز مساء الخميس، والجماهير تغني له يا "أصلي مش تقليد"، وكتبت الصفحة نفس العبارة تعليقا على الفيديو. وجاء نشر الفيديو بعد دقائق من إعلان الأهلي عن واحدة من أبرز الصفقات في الميركاتو الصيفي الحالي بضمه جناح الزمالك أحمد مصطفى زيزو في صفقة انتقال حر. يأتي هذا بينما ينتظر أن يلتحق زيزو ببعثة النادي الأهلي المشاركة في كأس العالم للأندية في الولايات المتحدة، والتي تبدأ في 14 يونيو الجاري، حيث يلعب في مجموعة تضم تضم بورتو وبالميراس وإنتر ميامي. ونشر الزمالك أيضا فيديو عبر حسابه الرسمي على منصة "إكس"، خلال تسديدة شيكابالا لركلة الترجيح الحاسمة أمام بيراميدز، على أنغام أغنية "صاحبي أنت اللي لوحدك شبهي"، فيما اعتبر أيضا رد على صفقة زيزو.

وفاة الممثلة العراقية غزوة الخالدي في أمريكا
وفاة الممثلة العراقية غزوة الخالدي في أمريكا

صحيفة الخليج

timeمنذ يوم واحد

  • صحيفة الخليج

وفاة الممثلة العراقية غزوة الخالدي في أمريكا

بغداد: زيدان الربيعي نعت نقابة الفنانين العراقيين، الجمعة، الممثلة العراقية غزوة الخالدي التي وافتها المنية في إحدى الولايات الأمريكية، حيث تقيم هناك منذ أكثر من 30 عاماً. وقالت النقابة في بيان: «ننعى بمزيد من الحزن والأسى غزوة الخالدي التي وافتها المنية، سائلين المولى عز وجل أن يتغمدها بواسع رحمته وأن يلهم ذويها ومحبيها الصبر والسلوان». وأوضحت النقابة أن «غزوة الخالدي بدأت مسيرتها الفنية عام 1965 وتعتبر من رائدات المسرح العراقي، حيث قدمت العديد من الأعمال المسرحية التي لاقت نجاحاً كبيراً وحققت شهرة واسعة من خلال عملها بالسينما وفي الدراما التلفزيونية». وأكدت أن «الراحلة عملت في ميادين متنوعة، مسرح، سينما، تلفزيون، إذاعة، وكتابة درامية، بجانب الإذاعة منذ عام 1972، وكان أول ظهور لها على خشبة المسرح حين كانت لا تزال طالبة في معهد الفنون الجميلة سنة 1965 في مسرحية الطوفان».

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store