"غروك 4" يتفوق على "كلاود" و"ديب سيك" رغم المخاوف المتعلقة بالسلامة
وجاء تفوق "غروك 4" على "LMArena"، هي منصة تصنيف لنماذج الذكاء الاصطناعي التوليدي. ومع ذلك، فإن هذا النوع من التصنيفات لا يأخذ في الاعتبار المخاطر المحتملة المتعلقة بالسلامة.
وعادةً ما يتم تقييم نماذج الذكاء الاصطناعي الجديدة بناءً على مجموعة متنوعة من المقاييس، بما في ذلك قدرتها على حل المسائل الرياضية، والإجابة على الأسئلة النصية، وكتابة الشيفرات البرمجية، بحسب تقرير لموقع "Mashable" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".
وتستخدم شركات الذكاء الاصطناعي الكبرى مجموعة متنوعة من التقييمات الموحدة لقياس فعالية نماذجها، مثل "Humanity's Last Exam"، وهو اختبار مكون من 2500 سؤال مصمم لتقييم أداء الذكاء الاصطناعي.
وعادةً، عندما تُصدر شركة مثل "أنثروبيك" أو "OpenAI" نموذجًا جديدًا، فإنه يُظهر تحسنًا في نتائج هذه الاختبارات مقارنة بسابقه. وليس غريبًا أن يتفوق "غروك 4" على "غروك 3" في بعض المقاييس الرئيسية، ولكنه يواجه أيضًا تحديًا في كسب قبول الرأي العام.
و"LMArena" هو موقع ويب يعتمد على المجتمع، ويتيح للمستخدمين اختبار نماذج الذكاء الاصطناعي جنبًا إلى جنب من خلال اختبارات عمياء. واتُهمت المنصة بالتحيز ضد النماذج المفتوحة المصدر، لكنها لا تزال واحدة من أشهر منصات تصنيف الذكاء الاصطناعي.
ووفقًا لاختبارات المنصة، جاء "غروك 4" -من شركة "xAI" التابعة لإيلون ماسك- ضمن المراكز الثلاثة الأولى في جميع الفئات التي اختُبر فيها باستثناء فئة واحدة.
وفي أحدث التصنيفات العامة للمنصة، حل "غروك 4" في المركز الثالث مناصفةً مع "GPT-4.5" من "OpenAI". أما نموذجا "o3" و"o4" فقد تعادلا في المركز الثاني. بينما جاء "Gemini 2.5 Pro" من "غوغل" المركز الأول.
وتقول "LMArena" إنها استخدمت النموذج "grok-4-0709"، وهو إصدار واجهة برمجة التطبيقات من "غروك 4" يستخدمه المطورون. وقد يُقلل هذا الأداء من إمكانات "غروك 4" الحقيقية، وفقًا لموقع "Bleeping Computer".
مع ذلك، يبلغ بعض مستخدمي "غروك 4" عن مشكلات أمنية كبيرة.
مشكلات أمنية
بينما اختبر بعض المستخدمين قدرات "غروك 4"، أراد آخرون معرفة ما إذا كان يتمتع بآليات أمان مقبولة. وتُروّج "XAI" لغروك باعتباره يقدم "إجابات غير منقحة"، إلا أن بعض المستخدمين أفادوا بتلقيهم ردودًا مزعجة للغاية من النموذج.
وقرر أحد مستخدمي منصة إكس اختبار "غروك" من منظور السلامة، وخلص في مقال إلى أن "غروك 4 من xAI لا يمتلك حواجز أمان فعالة".
واختبر المستخدم روبوت الدردشة طالبًا المساعدة في صنع غاز أعصاب يُسمى "تابون"، وكانت المفاجأة أن "غروك 4" قدم إجابة مفصلة حول كيفية تصنيعه المزعوم.
وللتوضيح، فإن تصنيع "تابون" ليس خطيرًا فحسب، بل غير قانوني تمامًا. ولدى روبوتات الدردشة الشهيرة الأخرى من "OpenAI" و"أنثروبيك" حواجز أمان محددة لتجنب مناقشة موضوعات تتعلق بالأسلحة الكيميائية والبيولوجية والإشعاعية والنووية.
تدرك "xAI" هذه المشكلات، وقامت منذ ذلك الحين بتحديث "غروك" للتعامل مع "الردود الإشكالية".

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الرجل
منذ 9 ساعات
- الرجل
شروط التقديم لمعسكر "سدايا" لتأهيل خريجي الذكاء الاصطناعي في أكسفورد
أعلنت الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا) عن إطلاق "معسكر هندسة تطبيقات الذكاء الاصطناعي"، بالتعاون مع جامعة أكسفورد البريطانية، وذلك بهدف تأهيل خريجي البكالوريوس والماجستير من الجامعات السعودية والعالمية في تخصصات الذكاء الاصطناعي أو علوم الحاسب الآلي أو ما يعادلها. يهدف المعسكر إلى تعزيز مهارات المشاركين في مجالات الذكاء الاصطناعي المتقدمة، مثل الرؤية الحاسوبية، والتعلم العميق، والنماذج التوليدية، وتقديم إشراف من خبراء دوليين في هذا المجال. وفقًا لتقرير نشرته وكالة الأنباء السعودية "واس"، يركز المعسكر على تدريب المشاركين في تصميم وتطوير نماذج الذكاء الاصطناعي باستخدام لغة البرمجة بايثون وأطر التعلم العميق مثل TensorFlow وPyTorch. كما يتضمن المعسكر تطبيق مشاريع متقدمة في الرؤية الحاسوبية، ومعالجة اللغة الطبيعية، والنماذج التوليدية، مع فرصة لتعلم استخدام أدوات احترافية مثل YOLO وHugging Face لتنفيذ حلول عملية. #سدايا بالتعاون مع جامعة أكسفورد تطلق معسكراً تدريبياً متقدماً في الذكاء الاصطناعي لتمكين الكفاءات الوطنية في الرؤية الحاسوبية، والتعلم العميق، والنماذج التوليدية. — SDAIA (@SDAIA_SA) August 13, 2025 يُغطي المعسكر عدة محاور تعليمية رئيسية، بما في ذلك بناء الأساس البرمجي للذكاء الاصطناعي باستخدام بايثون، والبرمجة من خلال مكتبات التعلم العميق، وتصميم الشبكات العصبية المتقدمة، بالإضافة إلى الرؤية الحاسوبية المتقدمة، وتطبيقات الذكاء الاصطناعي التوليدي، ومعالجة اللغات الطبيعية، فضلاً عن برمجة الذكاء الاصطناعي لتطوير حلول عملية. شروط التقديم للمعسكر 1- يجب أن يكون المتقدم سعودي الجنسية. 2- حاصلًا على درجة البكالوريوس أو الماجستير من جامعة سعودية أو عالمية في الذكاء الاصطناعي أو الحاسب الآلي أو ما يعادلها. 3- من خريجي عام 2023 وما بعده. 4- لا يقل المعدل التراكمي عن (4 من 5) أو (3.2 من 4) أو (80 من 100)، مع إجادة اللغة الإنجليزية. 5- اجتياز التدريب التأهيلي والمقابلات الشخصية. اقرأ أيضًا: تطبيقات الذكاء الاصطناعي تحقق قفزة هائلة في 2025 يُقدّم المعسكر بنموذج تعليمي مرن يتكون من مرحلتين: الأولى عن بُعد، تليها المرحلة الثانية في جامعة أكسفورد، ويستمر لمدة 8 أسابيع. يمكن التسجيل في المعسكر خلال الفترة من 13 إلى 14 أغسطس 2025. يأتي هذا المعسكر في إطار جهود "سدايا" لتنمية الكفاءات الوطنية من خلال شراكاتها الدولية مع الجامعات العالمية، بهدف تعزيز القدرات السعودية في تقنيات الذكاء الاصطناعي، بما يتماشى مع أهداف رؤية المملكة 2030 للتحول الرقمي.


أرقام
منذ 10 ساعات
- أرقام
وكالة: أبل تخطط للتوسع في مجال الروبوتات المدعومة بالذكاء الاصطناعي
تستعد شركة "أبل" لإطلاق مجموعة جديدة من المنتجات المدعومة بالذكاء الاصطناعي، تشمل روبوتات منزلية، ونسخة أكثر واقعية من المساعد الصوتي "سيري"، ومكبر صوت ذكي مزوّد بشاشة، وكاميرات أمنية منزلية، وفقاً لما ذكرته وكالة "بلومبرج". أفادت مصادر مطلعة للوكالة بأنه الشركة تستهدف طرح روبوت سطح مكتب يعمل كرفيق افتراضي في عام 2027، وأن هذا الجهاز سيكون محور استراتيجيتها للتوسع في مجال الذكاء الاصطناعي. وسيشبه الروبوت المكتبي جهاز "آيباد" مثبت على ذراع متحركة كي يمكنه تتبع حركة المستخدم، وإدارة المكالمات عبر "فيس تايم" بمرونة، إضافة إلى التفاعل في المحادثات اليومية بفضل نسخة جديدة كلياً من "سيري" ذات شخصية مرئية وأسلوب يشبه البشر. وأوضحت المصادر أنه من المقرر أن تطرح صانعة جوالات "آيفون" مكبر الصوت الذكي المزود بشاشة العام المقبل، كجزء من التوجه نحو منتجات المنازل الذكية منخفضة التكلفة. وفي مجال الأمن المنزلي، تطوّر "أبل" كاميرات جديدة ستكون جزءاً من نظام متكامل قادر على أتمتة وظائف المنزل، ويهدف هذا التوجه إلى تعزيز ترابط منتجات الشركة وجعل منظومتها أكثر جاذبية للمستخدمين. وإلى جانب هذه المنتجات، تعمل "أبل" على تطوير أجهزة "آيفون" أنحف بتصاميم جديدة، ونظارات ذكية، وجوالات قابلة للطي، وأجهزة هجينة تجمع بين "ماكبوك" و"آيباد"، بهدف تعويض تباطؤ مبيعات منتجاتها التقليدية، وإثبات أنها لا تزال قادرة على الابتكار.


الرجل
منذ 10 ساعات
- الرجل
آبل ترد على اتهامات ماسك: متجر التطبيقات ليس متحيزًا لـ OpenAI
رفضت شركة آبل الاتهامات التي وجهها إيلون ماسك، مؤسس شركة xAI، حول تحيز متجر التطبيقات ضد التطبيقات المنافسة لـ OpenAI. وقالت آبل في بيان: "نحن نعرض آلاف التطبيقات عبر التصنيفات والتوصيات الخوارزمية والقوائم التي يختارها الخبراء باستخدام معايير موضوعية." وجاء هذا البيان بعد تهديد إيلون ماسك بمقاضاة الشركة، حيث اتهمها بأنها "تتصرف بطريقة تجعل من المستحيل على أي شركة ذكاء صناعي غير OpenAI الوصول إلى المركز الأول في متجر التطبيقات." وأضاف ماسك أن هذا التحيز قد يضر بالشركات المنافسة التي تطور تقنيات مشابهة لـ OpenAI، موجهًا أصابع الاتهام لآبل لتأثيرها في ترتيب التطبيقات. تفاصيل شراكة آبل وOpenAI ويذكر أن آبل وOpenAI قد دخلتا في شراكة العام الماضي لدمج تقنيات الذكاء الاصطناعي لشركة OpenAI، مثل ChatGPT، في بعض من منتجات آبل مثل سيري ونظام iOS. وقد أشار البعض إلى أن هذه الشراكة قد تكون دافعًا وراء التحيز المحتمل لمصلحة OpenAI في متجر التطبيقات. آبل ترد على اتهامات إيلون ماسك بتفضيل OpenAI في متجر التطبيقات - المصدر | shutterstock ومع ذلك، لم تقدم آبل أي دليل يدعم مزاعم ماسك، وأكدت أنها تواصل عرض تطبيقات متنوعة بناءً على معايير موضوعية. وأوضحت أن التطبيقات التي يتم تصدرها في متجر التطبيقات يتم تحديدها من خلال مزيج من التوصيات الخوارزمية والتصنيفات القائمة على الخبرة، وليس من خلال أي تحيز لصالح أي جهة معينة. على الرغم من أن متجر التطبيقات في العام الماضي شهد تصدر تطبيقات أخرى مثل Perplexity وDeekSeek في قوائم التطبيقات الأكثر تحميلًا في مجال الذكاء الاصطناعي، فإن ماسك استمر في انتقاد الشركة، مشيرًا إلى ما أسماه 'سلوك آبل الذي يجعل من المستحيل التنافس في هذا المجال' الجدير بالذكر أن هذه الحادثة تأتي في وقت حساس لشركة آبل، التي تواجه ضغوطًا تنظيمية من الحكومات حول العالم لتحديد قواعد واضحة بشأن سيطرتها على سوق التطبيقات. فقد كان متجر التطبيقات محط انتقاد من قبل بعض الجهات. في ردها على هذه القضية، شددت آبل على أنها ملتزمة بتوفير منصة عادلة لجميع المطورين وتعرض التطبيقات بناءً على معايير تعتمد على التميز والجودة، دون أي تأثير خارجي على ترتيب التطبيقات.