
Anthropic تطلق Claude Opus 4.1 قبل وصول GPT-5
ويمثل هذا التحديث تحسينًا تدريجيًا للنموذج الرئيسي لدى الشركة، مع تركيز ملحوظ على الأداء في مجالات الترميز والاستدلال والمهام الوكيلة، مع الحفاظ على نفس تسعيرة الإصدار السابق.
قفزة نوعية في أداء البرمجة
حقق النموذج الجديد Opus 4.1 دقة بلغت 74.5 بالمئة على معيار SWE-bench Verified الخاص بهندسة البرمجيات، مقارنة بنسبة 72.5 بالمئة التي سجلها الإصدار السابق Opus 4. ويؤكد هذا التحسن المتقدم مكانة Anthropic في سوق البرمجة المؤسسية، حيث تستحوذ الشركة حاليًا على حصة سوقية تبلغ 42 بالمئة، متفوقة على OpenAI التي تبلغ حصتها 21 بالمئة فقط.
أكدت منصة GitHub أن Opus 4.1 يحقق مكاسب أداء ملحوظة في عمليات إعادة هيكلة الشيفات متعددة الملفات، بينما أشادت شركات تطوير مثل Rakuten Group بقدرة النموذج على تحديد التصحيحات الدقيقة داخل قواعد بيانات ضخمة من الشيفات، من دون إدخال تعديلات غير ضرورية أو التسبب بأخطاء.
أصبح النموذج متاحًا مباشرة من خلال GitHub Copilot للمشتركين في خطط Enterprise وPro Plus، ما يسهل على المطورين والمؤسسات الاستفادة منه في الوقت الفعلي.
توقيت استراتيجي في خضم التنافس
جاء إصدار Claude Opus 4.1 في لحظة حساسة، حيث تتهيأ OpenAI لإطلاق GPT-5، وسط توقعات بإصداره في أوائل أغسطس. وفي هذا السياق، صرح مايك كريغر، رئيس المنتجات في Anthropic، لموقع بلومبرغ قائلًا إن الشركة تركز على ما تملكه من إمكانات، بينما ما ستفعله الشركات الأخرى يبقى أمرًا خارج سيطرتهم.
ورغم أن ChatGPT يهيمن على السوق الاستهلاكية بأكثر من 100 مليون مستخدم، فإن Anthropic تواصل تعزيز موقعها في السوق المؤسسية. وتشير بيانات من شركة Menlo Ventures إلى أن Anthropic باتت تمتلك 32 بالمئة من سوق نماذج اللغة الكبرى الموجهة للمؤسسات، متقدمة على OpenAI التي تراجعت إلى 25 بالمئة، في انعكاس دراماتيكي للواقع في عام 2023، حين كانت حصة OpenAI تبلغ 50 بالمئة مقابل 12 بالمئة فقط لـ Anthropic.
تحسينات تدريجية في اختبارات الأداء
رغم أن Opus 4.1 يعد تحديثًا طفيفًا من حيث الرقم، إلا أنه يقدم تحسينات واضحة على مستوى عدة معايير. فقد ارتفعت نسبة النجاح في اختبار GPQA Diamond الخاص بالاستدلال على مستوى الدراسات العليا من 79.6 بالمئة إلى 80.9 بالمئة. كما سجل النموذج أداءً قويًا في اختبارات AIME للرياضيات لعام 2025 بنسبة 78.0 بالمئة، مقارنة بـ 75.5 بالمئة في النسخة السابقة.
لكن في المقابل، تراجع أداء النموذج في بعض المعايير مثل TAU-bench في فئة الطيران، حيث انخفضت النسبة من 59.6 بالمئة إلى 56.0 بالمئة، ما يعكس وجود تباين في مكاسب الأداء حسب نوعية المهام.
نفس السعر مع قدرات أكثر دقة
يحافظ Opus 4.1 على نفس هيكل التسعير المعتمد في الإصدار السابق، حيث تبلغ تكلفة المعالجة 15 دولارًا لكل مليون توكن إدخال، و75 دولارًا لكل مليون توكن إخراج، مما يجعله واحدًا من أغلى النماذج في السوق. ومع ذلك، تصفه الشركة بأنه بديل مباشر يمكن استبداله مكان Opus 4 دون الحاجة لتعديل التطبيقات أو البنى التحتية، مع تحسينات حقيقية في القدرة على التعامل مع التعليمات المعقدة والمهام الواقعية.
وتركز Anthropic في هذا التحديث على منح المؤسسات والمطورين نموذجًا أكثر دقة في التعامل مع التعليمات، خصوصًا في بيئات التطوير البرمجي، ما يجعل النموذج مناسبًا لتطبيقات تتطلب موثوقية عالية وسرعة في التفاعل.
سباق لا يهدأ في عالم الذكاء الاصطناعي
يعكس إطلاق Claude Opus 4.1 الواقع المتسارع لسوق الذكاء الاصطناعي، حيث تتسابق الشركات لتقديم نماذج أقوى وأدق قبل المنافسين. وبينما تستعد OpenAI للكشف عن GPT-5، تسعى Anthropic لتثبيت أقدامها في سوق المؤسسات، معززة سجلها في مجالات الترميز، والمنطق، والاستجابة الدقيقة للتعليمات.
ويبدو أن السنوات القادمة ستشهد مزيدًا من التنافس بين الشركات الكبرى مثل OpenAI وAnthropic وGoogle، حيث تتقاطع الابتكارات التقنية مع احتياجات المستخدمين في القطاعات المختلفة، وتصبح دقة النموذج وفعاليته معيارًا أساسيًا للتفوق في هذا المجال شديد الديناميكية.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


عرب هاردوير
منذ 8 ساعات
- عرب هاردوير
Anthropic تطلق Claude Opus 4.1 قبل وصول GPT-5
أعلنت شركة Anthropic عن إصدار النموذج الجديد Claude Opus 4.1، في خطوة تعكس تصاعد حدة المنافسة في سوق الذكاء الاصطناعي، خاصة مع اقتراب OpenAI من إطلاق نموذج GPT-5 المرتقب في أغسطس. ويمثل هذا التحديث تحسينًا تدريجيًا للنموذج الرئيسي لدى الشركة، مع تركيز ملحوظ على الأداء في مجالات الترميز والاستدلال والمهام الوكيلة، مع الحفاظ على نفس تسعيرة الإصدار السابق. قفزة نوعية في أداء البرمجة حقق النموذج الجديد Opus 4.1 دقة بلغت 74.5 بالمئة على معيار SWE-bench Verified الخاص بهندسة البرمجيات، مقارنة بنسبة 72.5 بالمئة التي سجلها الإصدار السابق Opus 4. ويؤكد هذا التحسن المتقدم مكانة Anthropic في سوق البرمجة المؤسسية، حيث تستحوذ الشركة حاليًا على حصة سوقية تبلغ 42 بالمئة، متفوقة على OpenAI التي تبلغ حصتها 21 بالمئة فقط. أكدت منصة GitHub أن Opus 4.1 يحقق مكاسب أداء ملحوظة في عمليات إعادة هيكلة الشيفات متعددة الملفات، بينما أشادت شركات تطوير مثل Rakuten Group بقدرة النموذج على تحديد التصحيحات الدقيقة داخل قواعد بيانات ضخمة من الشيفات، من دون إدخال تعديلات غير ضرورية أو التسبب بأخطاء. أصبح النموذج متاحًا مباشرة من خلال GitHub Copilot للمشتركين في خطط Enterprise وPro Plus، ما يسهل على المطورين والمؤسسات الاستفادة منه في الوقت الفعلي. توقيت استراتيجي في خضم التنافس جاء إصدار Claude Opus 4.1 في لحظة حساسة، حيث تتهيأ OpenAI لإطلاق GPT-5، وسط توقعات بإصداره في أوائل أغسطس. وفي هذا السياق، صرح مايك كريغر، رئيس المنتجات في Anthropic، لموقع بلومبرغ قائلًا إن الشركة تركز على ما تملكه من إمكانات، بينما ما ستفعله الشركات الأخرى يبقى أمرًا خارج سيطرتهم. ورغم أن ChatGPT يهيمن على السوق الاستهلاكية بأكثر من 100 مليون مستخدم، فإن Anthropic تواصل تعزيز موقعها في السوق المؤسسية. وتشير بيانات من شركة Menlo Ventures إلى أن Anthropic باتت تمتلك 32 بالمئة من سوق نماذج اللغة الكبرى الموجهة للمؤسسات، متقدمة على OpenAI التي تراجعت إلى 25 بالمئة، في انعكاس دراماتيكي للواقع في عام 2023، حين كانت حصة OpenAI تبلغ 50 بالمئة مقابل 12 بالمئة فقط لـ Anthropic. تحسينات تدريجية في اختبارات الأداء رغم أن Opus 4.1 يعد تحديثًا طفيفًا من حيث الرقم، إلا أنه يقدم تحسينات واضحة على مستوى عدة معايير. فقد ارتفعت نسبة النجاح في اختبار GPQA Diamond الخاص بالاستدلال على مستوى الدراسات العليا من 79.6 بالمئة إلى 80.9 بالمئة. كما سجل النموذج أداءً قويًا في اختبارات AIME للرياضيات لعام 2025 بنسبة 78.0 بالمئة، مقارنة بـ 75.5 بالمئة في النسخة السابقة. لكن في المقابل، تراجع أداء النموذج في بعض المعايير مثل TAU-bench في فئة الطيران، حيث انخفضت النسبة من 59.6 بالمئة إلى 56.0 بالمئة، ما يعكس وجود تباين في مكاسب الأداء حسب نوعية المهام. نفس السعر مع قدرات أكثر دقة يحافظ Opus 4.1 على نفس هيكل التسعير المعتمد في الإصدار السابق، حيث تبلغ تكلفة المعالجة 15 دولارًا لكل مليون توكن إدخال، و75 دولارًا لكل مليون توكن إخراج، مما يجعله واحدًا من أغلى النماذج في السوق. ومع ذلك، تصفه الشركة بأنه بديل مباشر يمكن استبداله مكان Opus 4 دون الحاجة لتعديل التطبيقات أو البنى التحتية، مع تحسينات حقيقية في القدرة على التعامل مع التعليمات المعقدة والمهام الواقعية. وتركز Anthropic في هذا التحديث على منح المؤسسات والمطورين نموذجًا أكثر دقة في التعامل مع التعليمات، خصوصًا في بيئات التطوير البرمجي، ما يجعل النموذج مناسبًا لتطبيقات تتطلب موثوقية عالية وسرعة في التفاعل. سباق لا يهدأ في عالم الذكاء الاصطناعي يعكس إطلاق Claude Opus 4.1 الواقع المتسارع لسوق الذكاء الاصطناعي، حيث تتسابق الشركات لتقديم نماذج أقوى وأدق قبل المنافسين. وبينما تستعد OpenAI للكشف عن GPT-5، تسعى Anthropic لتثبيت أقدامها في سوق المؤسسات، معززة سجلها في مجالات الترميز، والمنطق، والاستجابة الدقيقة للتعليمات. ويبدو أن السنوات القادمة ستشهد مزيدًا من التنافس بين الشركات الكبرى مثل OpenAI وAnthropic وGoogle، حيث تتقاطع الابتكارات التقنية مع احتياجات المستخدمين في القطاعات المختلفة، وتصبح دقة النموذج وفعاليته معيارًا أساسيًا للتفوق في هذا المجال شديد الديناميكية.


صحيفة الخليج
منذ 9 ساعات
- صحيفة الخليج
تنافس أنظمة الدفع الدولية
د. محمد الصياد* صراع السلطة العالمية المندلع بين الولايات المتحدة الأمريكية والصين، له عدة أوجه، ويُخاض على أكثر من صعيد.. جيوسياسي وتجاري، واقتصادي (استثماري)، استحواذي، وتكنولوجي. في الشهور الثلاثة الماضية، تابعنا معاً الإنجازات التي فاجأت بها الصين العالم في مجال الذكاء الاصطناعي، حين تحدثت وسائط الميديا الأمريكية ومنها ال «سي إن إن» عن أن أحدث نموذج صيني للذكاء الاصطناعي، الذي يتميز بالكفاءة والقوة بشكل مدهش الأمر يتعلق بطرح الشركة الصينية الناشئة «هانغتشو ديب سيك» لأبحاث التكنولوجيا الأساسية للذكاء الاصطناعي Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co، نموذجها للاستدلال DeepSeek R1، من الجيل الأول، تم تدريبه باستخدام التعلم التعزيزي واسع النطاق (RL)، لحل مهام الاستدلال المعقدة، عبر مجالات مثل الرياضيات والترميز واللغة، ويوفر استجابات مماثلة لنماذج اللغة الأمريكية، مثل GPT-4o وo1، اللذين أنتجتهما شركة OpenAI الأمريكية، وهو ما أحدث ضجة كبيرة في صناعة التكنولوجيا، وأثار أعصاب «وول ستريت». حدة هذا الصراع القطبي تدور رحاه، هذه المرة، حول أنظمة الدفع الدولية التي تهيمن عليها تاريخياً الولايات المتحدة، فقد قرر إقليم هونج كونج التابع للصين تحدي شركات التسوية الأوروبية (European settlement houses)، التي تدير أصولا بقيمة 62 تريليون دولار. «يوروكلير» Euroclear البلجيكية، التي توفر خدمات التسوية المحلية والعابرة للحدود والخدمات ذات الصلة في العالم لمعاملات السندات والأسهم والصناديق المتداولة في البورصة وصناديق الاستثمار المشترك، ومجموعة «كليرستريم» Clearstream Group اللوكسمبورجية، إحدى أذرع مجموعة «دويتشه بورس»، التي تقدم خدمات التسوية والحفظ، بالإضافة إلى خدمات أخرى ذات صلة بالأوراق المالية في جميع فئات الأصول. باختصار، هذه البيوتات المالية الأوروبية، تضطلع بوظيفة حماية الأصول وحفظ السجلات، ونقل الأصول من البائعين إلى المشترين. و«يوروكلير» هي الشركة العاملة في السوق بأصول تبلغ 42 تريليون دولار، بينما تبلغ أصول «كليرستريم» 20 تريليون دولار. ويبدو أن الصين قررت، أن الوقت قد حان لبورصة هونغ كونغ للتداول، لأن تقتطع لنفسها حصة من هذا السوق بالغ الضخامة، بعد أن تهيأت لها الظروف المناسبة، متمثلة في سعى أوروبا لمصادرة 200 مليار يورو من الأصول الروسية المجمدة والاستيلاء عليها، فضلاً عن توجه الصين تدريجياً لتدويل الرنمينبي/اليوان الصيني، فقد أعلنت بورصات ومقاصة هونغ كونغ، التي تدير سوق الأسهم، يوم الثلاثاء 4 مارس/ آذار 2025، أنها تعمل مع السلطة النقدية في الإقليم، لتطوير مركز تسوية دولي آسيوي قادر على منافسة «يوروكلير» البلجيكية و«كليرستريم» اللوكسمبورجية، وذلك في إطار سعي الصين لتقليل اعتمادها على الأنظمة المالية الغربية، في ظل تصاعد التوترات الجيوسياسية العالمية. على المدى الطويل، سوف يؤثر هذا التحول، في مؤسسات التسوية الأوروبية، وذلك دفعاً لثمن انغماس بلدانها بشكل عميق وخطر في الصراع الجيوسياسي الأوروبي، بما يشمل ذلك توجسات دول الجنوب العالمي من شراسة سياسة العقوبات والسياسات النقدية والمالية، التي صارت تطغى على طبيعة الإدارة الاقتصادية الكلية للاتحاد الأوروبي، نتيجة لهوسه بالحرب، التي يندفع إليها في إعادة إنتاج للأجواء الاقتصادية، التي سادت أوروبا عشية الحربين العالميتين الأولى والثانية. كانت هونغ كونغ دائما قناة جذب الاستثمار الأجنبي للصين، وهي في طريقها لاستعادة مكانتها كمركز مالي بعد فشل الثورة الغربية الملونة فيها عام 2019. قد لا تكون الصين – على المدى القصير على الأقل - في وارد تدويل الرنمينبي كعملة احتياطية أجنبية، بقدر ما هي مهتمة فقط بنشر عملتها في الحيز العالمي بمقدار محسوب من أجل تسهيل شراء المنتجات الصينية في أي وقت، وذلك على الرغم من تأكيد بوني تشان ييتينج، الرئيسة التنفيذية لبورصة هونغ كونغ، بأن المشروع سيوفر «منصة لطموح بكين في تدويل الرنمينبي، من خلال تعميق استخدام العملة كأصل احتياطي عالمي ولتسوية الصفقات، وتعزيز تطوير سوق الدخل الثابت في هونغ كونغ، ما يتيح الانتقال للمرحلة الثانية من تدويل الرنمينبي ويعزز مكانة هونغ كونغ كمركز مالي عالمي». وتهدف مذكرة التفاهم الموقعة بين بورصة هونغ كونغ وهيئة النقد فيها إلى تحويل وحدة أسواق المال المركزية التابعة لهيئة النقد في هونغ كونغ، والتي تتولى تسوية الديون، إلى دار أوراق مالية دولية يمكنها التعامل مع المدفوعات، عبر الحدود والعملات المختلفة. سيتمكن المستثمرون الأجانب من إدارة سيولة السندات المقومة بالرنمينبي، والاحتفاظ بأصول عالمية تتولى مسؤولية الحفاظ عليها سلطة هونغ كونغ.


عرب هاردوير
منذ 10 ساعات
- عرب هاردوير
OpenAI تطلق نماذج gpt-oss مفتوحة المصدر والقابلة للتشغيل محليًا
أطلقت شركة OpenAI اليوم نماذج ذكاء اصطناعي جديدة من نوع gpt-oss، وهي أول نماذج مفتوحة المصدر تصدرها الشركة منذ إطلاق GPT-2 في عام 2019. وعلى عكس النماذج السحابية المعروفة مثل GPT-4 وGPT-5، تتيح هذه النماذج الجديدة للمستخدمين إمكانية تحميلها وتشغيلها محليًا على أجهزتهم، ما يمثل تحولًا مهمًا في مشهد الذكاء الاصطناعي القابل للتخصيص. نموذجين بمواصفات مختلفة أصدرت OpenAI نموذجين هما gpt-oss-120b وgpt-oss-20b. ويتميز كلا النموذجين بكونهما معتمدان على بنية المحولات Transformer، ويدعمان ما يسمى بسلسلة التفكير CoT التي يمكن تعديلها بحسب الحاجة إلى مستوى منخفض أو متوسط أو عالٍ. يتم هذا التعديل ببساطة عبر سطر واحد في موجه النظام، ويمنح المستخدمين القدرة على التحكم في جودة النتائج مقابل سرعة الأداء واستهلاك الموارد. يحتوي النموذج الأصغر gpt-oss-20b على 21 مليار معامل، لكنه يستخدم تقنيات خبراء مختلطة MoE لتقليص عدد المعاملات النشطة إلى 3.6 مليار لكل توكن. ويمكن لهذا النموذج العمل على أجهزة استهلاكية تملك ذاكرة 16 جيجابايت أو أكثر. أما النموذج الأكبر gpt-oss-120b، فيحتوي على 117 مليار معامل تنخفض إلى 5.1 مليار لكل توكن بفضل نفس التقنية، لكنه يتطلب 80 جيجابايت من الذاكرة، ما يجعله مناسبًا فقط للأجهزة المتقدمة أو وحدات معالجة الذكاء الاصطناعي مثل Nvidia H100. أداء مقارب للنماذج السحابية تقول OpenAI إن أداء النماذج الجديدة يقارب أداء بعض النماذج السحابية المتقدمة التابعة لها. فالنموذج الأكبر gpt-oss-120b يأتي بين نموذجي o3 وo4-mini في أغلب الاختبارات. أما النموذج الأصغر فيأتي بفارق طفيف خلف هذه النماذج، مع أداء مميز في المهام الرياضية والبرمجية. وعلى الرغم من هذا الأداء الجيد، تظهر فجوة في اختبار المعرفة الشهير Humanity's Last Exam، حيث حصل gpt-oss-120b على نسبة 19 بالمئة فقط مقارنة بـ 24.9 بالمئة لنموذج o3، في حين تصدر النموذج الأحدث من جوجل Gemini Deep Think بنتيجة 34.8 بالمئة. تتميز النماذج الجديدة بقدرة على التعامل مع نافذة سياق تصل إلى 128 ألف توكن، وهي مساحة ضخمة تسمح بفهم وتحليل كميات كبيرة من النصوص في نفس الجلسة. فرص تخصيص هائلة على الرغم من أن النماذج الجديدة تقتصر على النصوص فقط ولا تدعم الوسائط المتعددة مباشرة، فإن OpenAI ترى في هذه الخطوة فرصة لمن لا يرغب في الاعتماد على الخدمات السحابية. فالتشغيل المحلي للنموذج يضمن وقت استجابة أقل، ويمنح المستخدمين حرية تخصيص أعلى، فضلًا عن حماية خصوصية البيانات الحساسة داخل بيئتهم الخاصة. ويدرك فريق OpenAI أن كثيرًا من المؤسسات التي تعتمد على نماذجها السحابية، تلجأ في نفس الوقت إلى نماذج مفتوحة المصدر لأغراض محددة. ولهذا صممت الشركة نماذج gpt-oss بطريقة تسمح بدمجها ضمن أنظمة تعتمد أيضًا على النماذج السحابية التابعة لـ OpenAI، ما يتيح حلولًا هجينة تجمع بين المحلي والسحابي. تراخيص مفتوحة ومجتمع تطوير نشط تخضع النماذج الجديدة لرخصة Apache 2.0 المفتوحة، ما يتيح للمطورين تعديلها وتخصيصها بالكامل لتتناسب مع استخداماتهم الخاصة. وتعد هذه المرونة عاملًا مهمًا في تمكين الشركات والأفراد من بناء حلول ذكاء اصطناعي تلائم احتياجاتهم الدقيقة. ورغم قوة هذه النماذج، تؤكد OpenAI أنها لا تهدف إلى أن تكون بديلًا مباشرًا للنماذج الاحتكارية مثل GPT-4. بل تمثل هذه النماذج خيارًا جديدًا لمن يبحث عن تشغيل الذكاء الاصطناعي في بيئة خاصة مع إمكانات تعديل وتخصيص واسعة. اختبارات أمان صارمة لم تكن OpenAI غافلة عن المخاطر المحتملة التي قد تنشأ من إتاحة نماذج قوية بهذا الشكل. ولذلك أجرى الفريق تجارب تهدف إلى اختبار أسوأ السيناريوهات من خلال محاولة جعل النماذج تتصرف بطريقة خبيثة. ورغم كل المحاولات، لم تنجح النماذج في تقديم سلوك ضار بجودة عالية، وهو ما اعتبرته الشركة مؤشرًا على فاعلية أساليب التوجيه والانحياز المتعمد المدمجة في البنية الداخلية للنموذج. وقد اعتمدت الشركة في تقييم هذه المخاطر على ما تسميه إطار الاستعداد Preparedness Framework، وهو نظام داخلي لتقييم مخاطر النماذج المتقدمة وتوجيه تطويرها نحو الاستخدام الآمن. تحميل مجاني ودعم فني بدءًا من اليوم، يمكن للمطورين تحميل النموذجين gpt-oss-120b وgpt-oss-20b عبر منصة HuggingFace، كما أطلقت OpenAI مستودعات GitHub تضم الكود المصدري وطرق التشغيل والدعم. وتوفر الشركة أيضًا نسخًا جاهزة من هذه النماذج على خوادمها لمن يرغب في اختبارها قبل دمجها ضمن البنية التحتية الخاصة به. وبهذا الإصدار، تعيد OpenAI فتح باب التفاعل مع مجتمع الذكاء الاصطناعي العالمي، من خلال تقديم أدوات مفتوحة ومرنة، دون أن تتنازل عن ضوابط الأمان أو جودة النماذج، لتكون هذه الخطوة بداية حقبة جديدة من الذكاء الاصطناعي المحلي القوي والمخصص.