logo
مقارنة بين نموذجي OpenAI o3-mini و DeepSeek-R1

مقارنة بين نموذجي OpenAI o3-mini و DeepSeek-R1

أطلقت شركة OpenAI آخرًا نموذج o3-mini الجديد، وأتاحته لجميع مستخدمي ChatGPT. وكان ذلك بعد إطلاق نموذج DeepSeek-R1 بمدة قصيرة، وهو نموذج صيني أحدث ضجة كبيرة في الوسط التقني بفضل قدراته المتقدمة وتكلفته المنخفضة. ومنذ ظهوره، بدأت المقارنات بينه وبين النماذج اللغوية الأكثر شعبية.
في هذا المقال، سنوضح الفرق بينه وبين النموذج الأحدث من OpenAI، استنادًا إلى نتائج بعض الاختبارات العالمية المصممة لاختبار قدرات نماذج الذكاء الاصطناعي.
اختبار LiveBench
LiveBench هو اختبار لتقييم أداء النماذج اللغوية الكبيرة (LLMs) في مجموعة متنوعة من المهام، مثل: الرياضيات، والبرمجة، والتفكير المنطقي، واللغة، واتباع التعليمات، وتحليل البيانات.
فيما يلي نتائج الاختبارات التي حصل عليها كل من o3-mini و R1 في المهام المختلفة:
متوسط الأداء العام:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 73.94.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 71.38.
يتفوق o3-mini بفارق طفيف في الأداء العام.
متوسط الأداء في التفكير والاستدلال:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 89.58.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 83.17.
يتفوق o3-mini في مهام التفكير المنطقي، مما يدل على قدرته القوية على التحليل واستخلاص النتائج.
متوسط الأداء في البرمجة:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 82.74.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 66.74.
يتفوق o3-mini بنحو كبير في البرمجة، مما يشير إلى فهمه العميق للتعليمات البرمجية، وقدرته على حل المشكلات البرمجية المختلفة.
متوسط الأداء في الرياضيات:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 65.65.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 79.54.
يتفوق DeepSeek-R1 في المهام الرياضية، مما يشير إلى قدرته العالية على الاستدلال العددي وحل المشكلات الحسابية.
متوسط الأداء في تحليل البيانات:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 70.64.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 69.78.
يتفوق o3-mini بنحو بسيط في تحليل البيانات ومعالجتها.
متوسط الأداء اللغوي:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 50.68.
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 48.53.
يتفوق o3-mini بنحو طفيف في المهام اللغوية.
متوسط الأداء في مجال فهم المعلومات:
نموذج OpenAI o3-mini: حصل على نتيجة تبلغ 84.36
نموذج DeepSeek-R1: حصل على نتيجة تبلغ 80.51
يتفوق o3-mini في الفهم العام لمختلف المهام.
اختبارات أخرى:
اختبار NYT Connections لحل الألغاز:
حصل o3-mini على 72.4 نقطة، مما يجعله من أفضل النماذج في حل الألغاز.
حصل DeepSeek-R1 على 54.4 نقطة، مما يعني أن o3-mini يتفوق عليه بفارق 18 نقطة.
اختبار Humanity's Last Exam لقياس دقة النموذج وقدرته على تقديم إجابات صحيحة:
نموذج o3-mini (high): يتمتع بدقة تبلغ 13.0%.
نموذج DeepSeek-R1: يتمتع بدقة تبلغ 9.4%.
يتمتع o3-mini بدقة أعلى، مما يدل على قدرته العالية على تقديم إجابات صحيحة.
السعر:
النموذج
السعر لكل مليون رمز إدخال
السعر لكل مليون رمز إخراج
O3-mini
55 سنتًا.
4 دولارات و 40 سنتًا.
DeepSeek-R1
14 سنتًا.
دولارين و 19 سنتًا.
تُعد التكلفة أمرًا مهمًا لمطوري التطبيقات، وتشير هذه الأرقام إلى أن DeepSeek-R1 هو الخيار المناسب لمن يبحثون عن نموذج اقتصادي.
الخلاصة:
يتفوق نموذج OpenAI o3-mini الجديد على DeepSeek-R1 في معظم الاختبارات، خاصة في الاستدلال والبرمجة والأداء العام. ومع ذلك، يتفوق DeepSeek-R1 في الرياضيات. ومن حيث التكلفة، فإن DeepSeek-R1 أكثر اقتصادية، مما يجعله خيارًا مناسبًا لمن يبحثون عن نموذج منخفض التكلفة.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

الإمارات تطلق "ستارجيت".. أقوى مركز ذكاء اصطناعي بالشراكة مع OpenAI
الإمارات تطلق "ستارجيت".. أقوى مركز ذكاء اصطناعي بالشراكة مع OpenAI

عرب هاردوير

timeمنذ 6 ساعات

  • عرب هاردوير

الإمارات تطلق "ستارجيت".. أقوى مركز ذكاء اصطناعي بالشراكة مع OpenAI

أعلنت شركة OpenAI -المُطوّرة لنموذج ChatGPT- عن تعاونها مع مجموعة G42 الإماراتية وعدد من الشركات التكنولوجية الكبرى لإنشاء مركز بيانات ضخم للذكاء الاصطناعي في أبوظبي، ليصبح أول مشروع واسع النطاق للشركة خارج الولايات المتحدة. اقرأ أيضًا: مشروع ستارجيت الإمارات: طموح تقني بقدرة 1 جيجاواط كشفت OpenAI و G42 أنّ مركز البيانات ستبلغ طاقته 1 جيجاواط، ليكون ضمن أضخم مراكز البيانات عالميًا. وسيشمل المشروع، المُسمى ستارجيت الإمارات " Stargate UAE"، بنية تحتية مُتطوّرة تدعم تطبيقات الذكاء الاصطناعي، في إطار مساعي الدولة لتصبح مركزًا عالميًا لهذه التكنولوجيا. تقود شركة G42 المشروع -وهي شركة ذكاء اصطناعي يشرف عليها الشيخ طحنون بن زايد آل نهيان -مستشار الأمن الوطني الإماراتي وشقيق رئيس الدولة. وكجزء من الاتفاقية، ستتوفّر نسخة مُحسنّة من ChatGPT مجانًا لسكان الإمارات. الجدول الزمني والتمويل ستنتهي المرحلة الأولى (بقدرة 200 ميجاواط) بحلول نهاية 2026. ستموِّل G42 بناء المُنشأة، بينما تتولّى شركتيّ OpenAI و Oracle تشغيل المركز. يضم المشروع شركاء آخرين مثل SoftBank وإنفيديا وCisco. كما ستستثمر G42 مبلغًا مُماثلًا في مشروع "ستارجيت" الأمريكي، وهو شبكة مراكز بيانات تبلغ قيمتها 100 مليار دولار بتمويل من OpenAI وSoftBank. ولم يُكشف عن تكلفة المشروع الإماراتي، رغم أن المشاريع المُماثلة في الولايات المتحدة تتجاوز 10 مليارات دولار. مُفاوضات أمريكية حاسمة جاء المشروع بعد أشهر من المُفاوضات بين الإمارات وإدارة ترامب، وأُبرمت اتفاقية الأسبوع الماضي تسمح للإمارات باستيراد 500 ألف رقاقة (شريحة) ذكاء اصطناعي سنويًا، مُتجاوزةً قيود إدارة بايدن التي كانت تُقيّد توريد هذه التكنولوجيا للحُلفاء المُقربين فقط. ولإقناع واشنطن بشراكتها الموثوقة، نفذّت الإمارات عدّة إجراءات، منها: التزامها باستثمار 1.4 تريليون دولار في الولايات المتحدة. استخدام ملياريّ دولار من عملات كريبتو تابعة لشركة ترامب للاستثمار في قطاع التشفير. استضافة كبار المسؤولين التنفيذيين لشركات التكنولوجيا الأمريكية في أبوظبي. وتُخطّط الإمارات لجذب المزيد من الشركات الأمريكية لاستئجار مراكز بياناتها المُخطّط لها (بقدرة 5 جيجاوات)، و عرضّت النموذج الأوّلي للمشروع خلال زيارة ترامب الأخيرة للمنطقة. استراتيجية الإمارات: مركزًا للذكاء الاصطناعي في آسيا وإفريقيا تستهدف الدولة أن تصبح مِحورًا لتشغيل خوادم (سيرفرات) الذكاء الاصطناعي القريبة من مُستخدمي إفريقيا والهند، والذي يُقلّل زمن نقل البيانات ويُعزّز كفاءة الخدمات. يأتي الإعلان في أسبوع حافل لـ OpenAI، التي أعلنت أيضًا عن: حصولها على تمويل 11.6 مليار دولار لتوسيع مركز بياناتها في تكساس. استحواذها على شركة مُصمم آبل السابق جوني إيف مُقابل 6.5 مليار دولار. بهذه الخطوة، تُعزّز الإمارات مكانتها كوجهة رائدة في مجال الذكاء الاصطناعي عالميًا.

دراسة تكشف.. الذكاء الاصطناعي يتفوق على البشر في الذكاء العاطفي
دراسة تكشف.. الذكاء الاصطناعي يتفوق على البشر في الذكاء العاطفي

البوابة العربية للأخبار التقنية

timeمنذ 11 ساعات

  • البوابة العربية للأخبار التقنية

دراسة تكشف.. الذكاء الاصطناعي يتفوق على البشر في الذكاء العاطفي

اختبرت دراسة جديدة درجة الذكاء العاطفي لنماذج الذكاء الاصطناعي التوليدي، من خلال تقييم أداء ستة نماذج منها ChatGPT، باستخدام اختبارات قياسية للذكاء العاطفي (Emotional Intelligence – EI). حققت هذه النماذج متوسط نتيجة بلغ 82%، وهو أعلى بكثير من متوسط نتيجة المشاركين البشريين الذي بلغ 56%. ولم تقتصر كفاءة هذه الأنظمة على اختيار الإجابات المناسبة، بل تمكنت أيضًا من تصميم اختبارات جديدة للذكاء العاطفي بسرعة فائقة وبجودة عالية. وتشير نتائج الدراسة إلى إمكانية استخدام الذكاء الاصطناعي في مجالات تتطلب حساسية عاطفية مثل: التعليم، والتدريب، وحل النزاعات، بشرط توفر إشراف بشري مناسب. تفاصيل الدراسة تُعد النماذج اللغوية الكبيرة (LLMs) أنظمة ذكاء اصطناعي قادرة على معالجة اللغة البشرية وتفسيرها وتوليدها، ويُعد ChatGPT مثالًا بارزًا على هذا النوع من النماذج؛ إذ يمكنه الإجابة عن الأسئلة وحل المشكلات المعقدة. لكن هل يمكنه أيضًا أن يمتلك ذكاءً عاطفيًا مثل البشر؟ للتحقق من ذلك، اختبر فريق من جامعة جنيف (UNIGE) وجامعة برن (UniBE) ستة من نماذج الذكاء الاصطناعي التوليدي، وهي: ChatGPT-4 و ChatGPT-o1 و Gemini 1.5 Flash و Copilot 365 و Claude 3.5 Haiku و DeepSeek V3، باستخدام اختبارات ذكاء عاطفي تُستخدم عادة لتقييم الذكاء العاطفي لدى البشر. وتقول (Katja Schlegel)، محاضرة وباحثة رئيسية في معهد علم النفس في جامعة برن (UniBE)، والمؤلفة الرئيسية للدراسة: 'اخترنا خمسة اختبارات تُستخدم بنحو شائع في الأبحاث وبيئات العمل. تضمنت هذه الاختبارات مواقف مشحونة عاطفيًا لتقييم القدرة على فهم المشاعر وتنظيمها وإدارتها'. ومن الأسئلة المطروحة في الاختبارات: أحد زملاء مايكل سرق فكرته وتلقى التقدير غير المستحق. ما هو رد الفعل الأنسب من مايكل؟ أ) يواجه الزميل المعني مباشرة. ب) يتحدث إلى مديره عن الموقف. ج) يحمل ضغينة بصمت. د) يرد بسرقة فكرة أخرى. الخيار الأنسب هو ب). في الوقت ذاته، خضعت مجموعة من المشاركين البشريين إلى الاختبارات نفسها. وبعد الانتهاء من إجراء الاختبارات، حققت النماذج اللغوية الكبيرة نتائج أعلى بكثير، فقد قدمت إجابات صحيحة بنسبة تبلغ 82% مقابل 56% للبشر. نُشرت الدراسة في مجلة Communications Psychology، وأظهرت نتائجها أن أداء هذه النماذج تجاوز الأداء البشري. ويقول الدكتور (Marcello Mortillaro)، الباحث في جامعة جنيف والمشارك في الدراسة: 'تشير هذه النتائج إلى أن هذه الأنظمة لا تفهم المشاعر فقط، بل تدرك أيضًا كيفية التصرف بذكاء عاطفي'. وفي المرحلة الثانية من الدراسة، طلب الباحثون من نموذج ChatGPT-4 أن ينشئ اختبارات جديدة للذكاء العاطفي تتضمن سيناريوهات مبتكرة. وخضع لهذه الاختبارات الجديدة أكثر من 400 مشارك. وتقول (Katja Schlegel): 'ثبت أن هذه الاختبارات الجديدة كانت موثوقة وواضحة وواقعية مثل الإصدارات الأصلية التي استغرق تطويرها سنوات'. ويقول (Marcello Mortillaro): 'هذا يُظهر أن النماذج اللغوية الكبيرة لا يمكنها فقط اختيار أفضل إجابة من مجموعة خيارات، بل أيضًا توليد سيناريوهات جديدة ملائمة للسياق المطلوب. وهذا يعزز فكرة أن هذه النماذج تمتلك معرفة عاطفية'. الخاتمة تُمهّد هذه النتائج الطريق أمام دمج الذكاء الاصطناعي في مجالات كانت سابقًا حكرًا على البشر، مثل التعليم، والإرشاد، وإدارة النزاعات بشرط أن تُستخدم تحت إشراف خبراء مختصين.

'ستارجيت الإمارات'.. تحالف عالمي يقود ثورة البنية التحتية للذكاء الاصطناعي من أبوظبي
'ستارجيت الإمارات'.. تحالف عالمي يقود ثورة البنية التحتية للذكاء الاصطناعي من أبوظبي

البوابة العربية للأخبار التقنية

timeمنذ 12 ساعات

  • البوابة العربية للأخبار التقنية

'ستارجيت الإمارات'.. تحالف عالمي يقود ثورة البنية التحتية للذكاء الاصطناعي من أبوظبي

في خطوة تاريخية تُعزز مكانة دولة الإمارات العربية المتحدة كمركز عالمي للذكاء الاصطناعي والتعاون التكنولوجي، أطلقت مجموعة من الشركات التكنولوجية الرائدة عالميًا مشروع (ستارجيت الإمارات) Stargate UAE، ضمن مجمع الذكاء الاصطناعي الإماراتي الأمريكي في أبوظبي، الذي تبلغ طاقته التشغيلية 5 جيجاواط، ليكون مركزًا دوليًا للبنية التحتية المتقدمة في هذا المجال. ويمثل هذا المشروع المشترك، الذي يضم عمالقة مثل: (جي 42) الإماراتية، و(OpenAI)، وأوراكل، وإنفيديا، ومجموعة سوفت بنك، وسيسكو، مجمع حوسبة ضخم متطور للبنية التحتية للذكاء الاصطناعي، يهدف إلى تسريع الابتكار وتعميق التعاون الدولي في هذا المجال الحيوي. تفاصيل مشروع (ستارجيت الإمارات): يُعدّ مشروع (ستارجيت الإمارات) مجمع حوسبة ضخم للبنية التحتية للذكاء الاصطناعي يتميز بسعة أولية تبلغ 1 جيجاواط، وسيُقام هذا المشروع في مقر مجمع الذكاء الاصطناعي الإماراتي الأمريكي الجديد في أبوظبي، الذي من المخطط أن تصل سعته الإجمالية إلى 5 جيجاواط. ومن المتوقع أن يسهم هذا المشروع الضخم في دفع عجلة الابتكار في مجال الذكاء الاصطناعي على مستوى عالمي، ويوفر القدرات الحاسوبية الضخمة اللازمة لتطوير ونشر حلول الذكاء الاصطناعي المتقدمة. الأطراف المشاركة وأدوارها: ستتولى شركة (جي 42) الإماراتية مسؤولية بناء مشروع (ستارجيت الإمارات) الضخم، في حين ستتولى شركتا (OpenAI) وأوراكل إدارة تشغيل المشروع. وستشارك شركة (سيسكو) بتوفير أنظمة الأمان ذات الثقة الصفرية (Zero Trust Security) وبنية الاتصال الداعمة للذكاء الاصطناعي، وستزود شركة إنفيديا المشروع بأحدث أنظمتها من طراز (Grace Blackwell GB200)، التي تُعدّ من أقوى حلول الحوسبة للذكاء الاصطناعي في العالم، لضمان أعلى مستويات الأداء. وتُسهم مجموعة سوفت بنك كشريك فاعل في المبادرة. ومن المتوقع أن يبدأ تشغيل أول تجمع حوسبي ضمن مشروع (ستارجيت الإمارات) بقدرة تبلغ 200 ميجاواط في عام 2026، مما يمثل خطوة أولى نحو تحقيق السعة الإجمالية المخطط لها التي تصل إلى 5 جيجاواط في مجمع الذكاء الاصطناعي الإماراتي الأمريكي الجديد في أبوظبي. 'ستارجيت الإمارات'.. قاعدة متينة للذكاء الاصطناعي تدفع الاكتشافات والنمو الاقتصادي: يهدف مشروع (ستارجيت الإمارات) الطموح إلى توفير بنية تحتية متطورة وقدرات حوسبة فائقة على مستوى الدولة، مع التركيز في تقليل زمن معالجة البيانات بنحو كبير. وستمكّن هذه القدرات من تقديم حلول ذكاء اصطناعي تلبي المتطلبات المتزايدة لعالم يشهد نموًا متسارعًا في هذا المجال. كما يؤسس هذا المشروع قاعدة متينة للذكاء الاصطناعي، تتميز بقدرتها على التوسع والموثوقية العالية، ومن خلال هذه القاعدة، سيسرع المشروع من وتيرة الاكتشافات العلمية ويدفع عجلة الابتكار عبر العديد من القطاعات الحيوية، التي تشمل: الرعاية الصحية والطاقة والمالية والنقل. وستسهم هذه الأهداف في تعزيز النمو الاقتصادي المستقبلي والتنمية الوطنية لدولة الإمارات، مما يعزز مكانتها كمركز عالمي للذكاء الاصطناعي والابتكار. شراكة إماراتية أمريكية لتسريع الذكاء الاصطناعي: يأتي مشروع (ستارجيت الإمارات) في إطار شراكة إستراتيجية جديدة بين حكومتي دولة الإمارات والولايات المتحدة الأمريكية، تحت اسم (شراكة تسريع الذكاء الاصطناعي بين الولايات المتحدة ودولة الإمارات). وتهدف هذه الشراكة إلى تعزيز التعاون في مجال الذكاء الاصطناعي والتقنيات المتقدمة، لتطوير ذكاء اصطناعي آمن وموثوق ومسؤول يعود بفوائد طويلة الأمد على الإنسانية. وقد أُطلقت المرحلة الأولى من مجمع الذكاء الاصطناعي الإماراتي الأمريكي في أبوظبي، الذي وُصف بأنه الأكبر من نوعه خارج الولايات المتحدة الأمريكية، والذي سيحتضن مشروع (ستارجيت الإمارات)، خلال زيارة الرئيس الأمريكي ترامب للإمارات خلال شهر مايو الجاري. ويمتد هذا المجمع الجديد على مساحة تبلغ 10 أميال مربعة، مما يجعله أكبر منشأة من نوعها خارج الولايات المتحدة، وسيزوّد المجمع مراكز بيانات الذكاء الاصطناعي وموارد الحوسبة الإقليمية بقدرة تصل إلى 5 جيجاواط. كما سيعمل هذا المجمع باستخدام مزيج من الطاقة النووية، والطاقة الشمسية، والغاز الطبيعي لتقليل الانبعاثات الكربونية. وسيضم المجمع منتزهًا علميًا يهدف إلى تعزيز الابتكار، وتطوير المواهب، وبناء بنية تحتية مستدامة للحوسبة. وضمن هذا الإطار، ستقوم الجهات الإماراتية أيضًا بتوسيع استثماراتها في البنية التحتية الرقمية داخل الولايات المتحدة، من خلال مشاريع مثل (ستارجيت الولايات المتحدة)، تماشياً مع سياسة أمريكا أولًا للاستثمار. نقلة نوعية في مشهد الذكاء الاصطناعي العالمي: يمثل إطلاق مشروع (ستارجيت الإمارات) نقلة نوعية في مشهد الذكاء الاصطناعي لدولة الإمارات والمنطقة بأكملها، ويعكس طموح الإمارات المتزايد لتكون في طليعة الثورة الصناعية الرابعة. فمن خلال هذا المجمع العملاق والشراكة مع نخبة من شركات التكنولوجيا العالمية، لا تكتسب الإمارات قدرات حاسوبية ضخمة فحسب، بل ترسي أيضًا معايير جديدة للتعاون الدولي، والسيادة الرقمية، والتنمية المستدامة في مجال الذكاء الاصطناعي. كما سيُعزز هذا المشروع من قدرة الدولة على الابتكار، ودفع الاكتشافات العلمية، وتمكين التحول في قطاعات حيوية، مما يؤسس لمستقبل رقمي مزدهر ومسؤول يعود بالنفع على البشرية جمعاء.

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store