logo
دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

كشف باحثون في شركة OpenAI أنه حتى نماذج الذكاء الاصطناعي الأكثر تطورًا ما تزال غير قادرة على التفوق على المبرمجين البشر، مع أن الرئيس التنفيذي سام ألتمان صرّح سابقًا بأن هذه النماذج قد تتفوق على مهندسي البرمجيات المبتدئين بحلول نهاية العام الحالي.
اختبار كفاءة نماذج الذكاء الاصطناعي في البرمجة
في دراسة حديثة أجراها باحثون في شركة OpenAI، أظهرت النتائج أن النماذج المتقدمة من الذكاء الاصطناعي ما تزال غير قادرة على حل الغالبية العظمى من المهام البرمجية.
واعتمد الباحثون في تقييمهم على معيار جديد يُدعى SWE-Lancer، طُوّر باستخدام أكثر من 1400 مهمة برمجية مستمدة من منصة العمل الحر Upwork.
واختبر الباحثون ثلاثة نماذج متطورة من الذكاء الاصطناعي، هي:
نموذج o1 الخاص بشركة OpenAI.
نموذج GPT-4o الرائد من OpenAI.
نموذج Claude 3.5 Sonnet من شركة Anthropic.
وركز الاختبار في نوعين من المهام البرمجية، هما:
إصلاح الأخطاء البرمجية.
اتخاذ قرارات على مستوى عالٍ لإدارة المشاريع البرمجية.
ولضمان دقة التقييم، لم يُسمح للنماذج بالوصول إلى الإنترنت؛ مما منعها من الوصول إلى حلول جاهزة أو الاعتماد على أمثلة سابقة منشورة على الإنترنت.
النتائج:
واجهت نماذج الذكاء الاصطناعي صعوبة في التعامل مع المهام المطلوبة منها، ولم تتمكن من إصلاح سوى الأخطاء البرمجية البسيطة، وعجزت عن اكتشاف الأخطاء في المشاريع البرمجية الكبيرة أو تحليل أسبابها الجذرية.
ومع أن النماذج أظهرت سرعة أكبر من البشر في تنفيذ المهام، فإنها أخفقت في فهم الأخطاء، مما أدى إلى حلول غير دقيقة أو غير شاملة.
تفوق نسبي لنموذج Claude 3.5 Sonnet
بحسب الدراسة، أظهر نموذج Claude 3.5 Sonnet أداءً أفضل من نماذج OpenAI الأخرى، لكن معظم إجاباته كانت غير صحيحة. وأكد الباحثون أن أي نموذج ذكاء اصطناعي يحتاج إلى مستوى أعلى من الدقة والموثوقية قبل أن يُعتمد عليه في المهام البرمجية الحقيقية.
الخلاصة: الذكاء الاصطناعي لم يصل بَعد إلى مستوى مهندسي البرمجيات
تُشير هذه الدراسة إلى أن نماذج الذكاء الاصطناعي يمكنها أداء المهام البرمجية البسيطة بسرعة، لكنها ما تزال غير قادرة على التعامل مع المشاريع البرمجية المعقدة بكفاءة مماثلة لكفاءة المبرمجين البشر.
ومع أن مجال الذكاء الاصطناعي يتطور بسرعة، فإنه ما يزال غير قادر على العمل مثل المبرمجين البشريين. ومع ذلك، لم يمنع هذا بعض الشركات من التوجه نحو تقليص عدد المبرمجين البشريين لصالح نماذج الذكاء الاصطناعي، حتى مع عدم تفوقها في هذه المهام بَعد.

Orange background

Try Our AI Features

Explore what Daily8 AI can do for you:

Comments

No comments yet...

Related Articles

الإمارات تجعل ChatGPT Plus مجانًا لجميع المُقيمين في صفقتها مع OpenAI!
الإمارات تجعل ChatGPT Plus مجانًا لجميع المُقيمين في صفقتها مع OpenAI!

Arab Hardware

time9 hours ago

  • Arab Hardware

الإمارات تجعل ChatGPT Plus مجانًا لجميع المُقيمين في صفقتها مع OpenAI!

في خطوة كبيرة نحو تعزيز مكانتها كمركز عالمي للذكاء الاصطناعي، أعلنت الإمارات العربية المتحدة عن شراكة استراتيجية مع OpenAI -الشركة المطورة لـ ChatGPT. ستتيح هذه الشراكة لسكان الإمارات الوصول المجاني إلى ChatGPT Plus -النسخة المدفوعة- مجانًا للجميع! بالإضافة إلى استثمارات ضخمة في البنية التحتية للذكاء الاصطناعي، بمّا في ذلك إنشاء مركز بيانات مُتطوّر في أبوظبي. اشتراك ChatGPT Plus المجاني لسكان الإمارات سيتمكّن جميع المُقيمين في الإمارات العربية المتحدة قريبًا من استخدام ChatGPT Plus مجانًا، وهذا سيوفر لهم إمكانية الوصول إلى أحدث أدوات الذكاء الاصطناعي من OpenAI دون الحاجة إلى اشتراك مدفوع. نعم، قرأت ذلك بشكل صحيح -ChatGPT Plus مجاني. ذلك الاشتراك بقيمة 20 دولارًا شهريًا والذي يوفر استجابات أسرع وميزات مُحسّنة. يُستخدم شات جي بي تي حاليًا من قبل الملايين حول العالم لأغراض مُتعددة مثل الكتابة، البرمجة، التخطيط، والتعلُّم. هذه الخطوة تأتي كجزء من مُبادرة " OpenAI for Countries"، التي تهدف إلى مُساعدة الحكومات على تبنّي الذكاء الاصطناعي بطريقة تُلبّي احتياجات مواطنيها محليًا، مع ضمان التوافق مع القوانين الوطنية وحماية البيانات. كما تعكس رؤية الإمارات لتصبح رائدة في استخدام التقنيات الحديثة وجعلها في متناول الجميع. مركز بيانات الذكاء الاصطناعي في أبوظبي إلى جانب توفير ChatGPT Plus مجانًا، تشمل الشراكة بين OpenAI وحكومة الإمارات تطوير بنية تحتية مُتقدمة للذكاء الاصطناعي، أبرزها مشروع " Stargate UAE" في أبوظبي. سيكون هذا المركز واحدًا من أكبر مراكز بيانات الذكاء الاصطناعي في العالم، حيث سيتم بناء مركز حوسبة بقدرة 1 جيجاواط. ستبدأ المرحلة الأولى من المشروع -والتي توفر 200 ميجاواط من القدرة الحاسوبية- بالعمل بحلول عام 2026. ويأتي هذا المشروع بدعم من شركات كبرى مثل أوراكل، إنفيديا، سيسكو، سوفت بنك، وG42، والذي يُعزّز مكانة الإمارات كوجهة رائدة للابتكار التكنولوجي. استثمارات مُشتركة وشراكات عالمية كجزء من الاتفاقية، التزمت الإمارات العربية المتحدة بالاستثمار في مشاريع الذكاء الاصطناعي داخل الولايات المتحدة بنفس القدر الذي تستثمره محليًا. وفقًا لتقارير، قد يصل حجم الاستثمار الإجمالي إلى 20 مليار دولار، موزعةً بين مشاريع في الخليج وأمريكا، لتكون واحدةً من أكبر الصفقات في مجال الذكاء الاصطناعي. كما تُخطّط OpenAI لتوسيع شراكاتها مع دول أخرى، من المُقرر أن يزور كبير مسؤولي الاستراتيجيات بالشركة -جيسون كوون- عدّة دول في آسيا والمحيط الهادئ لبحث فرص مُماثلة. وبهذه الخطوات، تسعى الشركة إلى تعزيز انتشار الذكاء الاصطناعي عالميًا، مع تخصيص الحلول لتتناسب مع احتياجات كل دولة. إنّ توزيع ChatGPT Plus مجانًا أمر مُثير للإعجاب، لكن رؤية الإمارات العربية المتحدة تتجاوز ذلك بكثير. فهم يستثمرون في رأس المال البشري، وينشؤون جيلًا كاملًا يشعر فيه بالتعاون في مجال الذكاء الاصطناعي بشكل طبيعي تمامًا. تخيل لو أنّ كل مواطن في عام 1992 حصل على جهاز كمبيوتر مجاني وأسرع إنترنت مُتاح. إلى أي مدى كان سيبلغ مُستوى محو الأمية الرقمية اليوم؟ ختامًا، لا تقتصر هذه الشراكة على توفير أدوات الذكاء الاصطناعي للمواطنين، بل تُمثّل نقلة نوعية في مسيرة الإمارات لتصبح لاعبًا رئيسيًا في السباق التكنولوجي العالمي، مع تعزيز التعاون الدولي في هذا المجال الحيوي.

«OpenAI» تختار الإمارات أول دولة لإتاحة الوصول الوطني إلى ChatGPT
«OpenAI» تختار الإمارات أول دولة لإتاحة الوصول الوطني إلى ChatGPT

Emarat AlYoum

time10 hours ago

  • Emarat AlYoum

«OpenAI» تختار الإمارات أول دولة لإتاحة الوصول الوطني إلى ChatGPT

في إعلان رسمي هو الأول من نوعه، كشفت شركة OpenAI عن اختيار دولة الإمارات العربية المتحدة لتكون أول دولة في العالم تُفعّل الوصول الوطني إلى تقنيات ChatGPT، ضمن مشروع استراتيجي مشترك يهدف إلى تسريع تبنّي الذكاء الاصطناعي على نطاق واسع. ويأتي هذا الإعلان ضمن إطلاق مشروع 'Stargate UAE'، الذي يمثل أول مبادرة دولية ضمن برنامج 'OpenAI for Countries'. وسيتم بموجب هذا التعاون إنشاء مركز بيانات ضخم في أبوظبي بقدرة إجمالية تبلغ 1 جيجاواط، على أن يبدأ التشغيل الجزئي للمركز بقدرة 200 ميجاواط خلال عام 2026. وقالت الشركة في بيانها الرسمي إن هذه الشراكة تهدف إلى تمكين السكان في الإمارات من استخدام تقنيات ChatGPT بسهولة وعلى مستوى وطني، مما يجعل الدولة سبّاقة عالميًا في اعتماد الذكاء الاصطناعي كمورد يومي متاح للجميع. ورغم عدم صدور توضيح رسمي بشأن ما إذا كان ChatGPT Plus — النسخة المدفوعة من الخدمة — ستكون مشمولة مجانًا ضمن هذا التوجه، فإن صياغة البيان تشير إلى نية OpenAI لتوسيع نطاق الاستخدام بشكل غير مسبوق. هذا التعاون يعكس المكانة العالمية المتصاعدة لدولة الإمارات في مجال التكنولوجيا والذكاء الاصطناعي، ويأتي في إطار رؤيتها للتحول الرقمي الشامل، وتكريس موقعها كمركز عالمي للابتكار

مقارنة بين أفضل أدوات الذكاء الصناعي 2025.. مفاجآت غير متوقعة
مقارنة بين أفضل أدوات الذكاء الصناعي 2025.. مفاجآت غير متوقعة

Al Bawaba

timea day ago

  • Al Bawaba

مقارنة بين أفضل أدوات الذكاء الصناعي 2025.. مفاجآت غير متوقعة

شهدت أدوات الذكاء الاصطناعي تطورًا ملحوظًا في عام 2025، مما جعلها أكثر تكاملًا وفعالية في مختلف المجالات لذا إليكم مقارنة بين أبرز هذه الأدوات: 1. ChatGPT 4o (OpenAI) المميزات: يتميز بسرعة التفاعل الصوتي، ودعم تحليل الصور والفيديو، بالإضافة إلى قدراته المتقدمة في تحليل الأكواد البرمجية. العيوب: ترجمته أقل دقة مقارنةً بـ Gemini 2، وأداؤه في النصوص الطويلة أقل قليلًا. الاستخدام المثالي: مناسب للمحادثات الذكية، البرمجة، والمحتوى متعدد الوسائط 2. Gemini 2.5 (Google) المميزات: يدعم التفاعل متعدد الوسائط، ترجمة دقيقة، وإمكانيات متقدمة في تحليل الفيديو والصور. العيوب: أقل كفاءة في التفاعل الصوتي مقارنةً بـ ChatGPT 4o. الاستخدام المثالي: مثالي للمستخدمين الذين يحتاجون إلى دعم لغوي دقيق وتحليل وسائط متقدم 3. DeepSeek V3 المميزات: يتفوق في التحليل العميق واستنتاج المعلومات المعقدة، مما يجعله مناسبًا للبحث الأكاديمي والتحليل العلمي. العيوب: لا يدعم تحليل الصور والفيديو، وأقل كفاءة في المحادثات والتفاعل الصوتي. الاستخدام المثالي: مناسب للباحثين والأكاديميين الذين يحتاجون إلى تحليل بيانات متقدم 4. Qwen 2.5 Max المميزات: أداء متقدم في فهم اللغات الآسيوية والأوروبية، مع قدرات تحليلية عالية وأمان قوي. العيوب: لا يدعم تحليل الصور والفيديو، والتفاعل الصوتي أقل تطورًا. الاستخدام المثالي: مناسب للأعمال التجارية التي تتطلب دعمًا لغويًا متعددًا وأمانًا عاليًا 5. GitHub Copilot (Microsoft) المميزات: يساعد المطورين في كتابة وتحسين الكود بكفاءة، مع دعم متعدد للغات البرمجة. العيوب: قد يتطلب ضبطًا دقيقًا لتجنب الأخطاء البرمجية. الاستخدام المثالي: مناسب للمطورين الذين يبحثون عن تحسين إنتاجيتهم وتقليل الأخطاء البرمجية. 6. Jasper AI المميزات: يتميز بقدرته على إنشاء محتوى تسويقي عالي الجودة، مع دعم متعدد للغات. العيوب: قد تكون التكلفة مرتفعة لبعض المستخدمين. الاستخدام المثالي: مثالي للمسوقين وصناع المحتوى الذين يحتاجون إلى إنشاء محتوى جذاب بسرعة. 7. Imagen 4 وVeo 3 (Google) المميزات: توفر أدوات متقدمة لإنشاء الصور والفيديوهات بجودة عالية، مع دعم المؤثرات الصوتية والحوارات. العيوب: قد تتطلب موارد حوسبة عالية. الاستخدام المثالي: مناسبة للمبدعين والمصممين الذين يعملون على مشاريع مرئية متقدمة. الاستنتاج يعتمد اختيار الأداة المناسبة على احتياجات المستخدم إذا كنت تبحث عن تفاعل صوتي سريع فإن ChatGPT 4o هو الخيار الأمثل أم اذا كان الاستخدام لتحليل أكاديمي عميق DeepSeek V3 هو الأنسب،أما إذا كنت تحتاج إلى دعم لغوي متعدد وأمان عالي فإن Qwen 2.5 Maxهو الخيار المثالي.

DOWNLOAD THE APP

Get Started Now: Download the App

Ready to dive into the world of global news and events? Download our app today from your preferred app store and start exploring.
app-storeplay-store