logo
أمازون تكشف عن 'Nova Act'.. وكيل ذكاء اصطناعي لتصفح الإنترنت

أمازون تكشف عن 'Nova Act'.. وكيل ذكاء اصطناعي لتصفح الإنترنت

بدأت أمازون اختبار نموذج الذكاء الاصطناعي الجديد 'Nova Act'، المصمم لأداء مهام داخل المتصفح، مثل التسوق عبر الإنترنت.
وتتيح الشركة نموذجها الجديد حاليًا للمطورين فقط في إطار 'معاينة بحثية'، وتعمل الشركة على توسيع نطاق الوصول إلى نماذج الذكاء الاصطناعي الأخرى من سلسلة 'Nova' عبر بوابة إلكترونية جديدة، مما يسهل العثور عليها واستخدامها.
ويتيح نموذج 'Nova Act' إمكانيات مشابهة لوكيل 'Operator' من OpenAI، إذ يمكنه تنفيذ عمليات البحث في الويب، وإتمام عمليات الشراء، والإجابة عن استفسارات تتعلق بالمحتوى الظاهر في الشاشة، مع إمكانية تنفيذ المهام وفقًا لجدول زمني محدد. كما يتمتع بقدرة على فهم تعليمات تفصيلية، مثل تجنّب عروض التأمين الإضافية أثناء الشراء.
ومع أن 'Nova Act' متاح حاليًا للمطورين فقط، فإن أمازون أكدت أنه بدأ بالفعل في تنفيذ بعض المهام ضمن النسخة المطورة من المساعد الذكي المتطور 'أليكسا بلس Alexa Plus'.
ويُعد 'Nova Act' أول منتج يطرحه مختبر الذكاء الاصطناعي العام (AGI) التابع لأمازون، الذي يطمح إلى تطوير وكلاء ذكاء اصطناعي قادرين على تنفيذ مهام متعددة الخطوات، مثل تنظيم حفلات الزفاف أو التعامل مع العمليات التقنية المعقدة لتعزيز الإنتاجية.
وتسعى أمازون إلى تقديم وكلاء ذكاء اصطناعي يتجاوزون مجرد الإجابة عن الأسئلة أو إنشاء المحتوى البصري، في ظل المنافسة المتزايدة مع شركات مثل OpenAI وميتا وأنثروبيك وجوجل التي تراهن على تقديم مساعدين قادرين على أداء المهام تلقائيًا.
وينضم 'Nova Act' إلى خمسة نماذج أخرى أعلنتها أمازون في ديسمبر الماضي، وهي تشمل ثلاثة نماذج متخصصة في الفهم اللغوي، إلى جانب نماذج لإنشاء الصور والفيديو.
وعلى عكس بعض المنافسين الذين يركزون على تقديم نماذج فائقة القوة، تروّج أمازون لسلسلة 'Nova' من خلال إبراز سرعتها وتكلفتها المنخفضة، إذ تؤكد أن استخدامها يقلل التكاليف بنسبة قدرها 75% على الأقل مقارنة بالبدائل الأخرى.
ولتوسيع نطاق الوصول، أطلقت أمازون موقعًا إلكترونيًا جديدًا يتيح للمطورين والمستخدمين استكشاف إمكانيات هذه النماذج والإجابة عن استفساراتهم أو توليد المحتوى مباشرة.
وكان الوصول إلى هذه النماذج متاحًا في السابق فقط عبر 'Amazon Bedrock'، منصة الذكاء الاصطناعي السحابية من أمازون، التي توفر أيضًا إمكانية استخدام نماذج أخرى من DeepSeek وأنثروبيك وميتا.
وقال روهيت براساد، النائب الأول لرئيس الذكاء الاصطناعي العام في أمازون: 'لقد أنشأنا هذا الموقع لتمكين المطورين من اختبار أفكارهم بسرعة باستخدام نماذج Nova، ثم تطبيقها على نطاق واسع من خلال منصة Amazon Bedrock.'
ويتيح الموقع الجديد للمطورين تجربة Nova Act، في حين يمكن للراغبين في الاستفادة من إمكانياته التسجيل لتنزيل حزمة تطوير البرمجيات (SDK) وبدء اختبار النموذج عمليًا.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

تحدّث مع الذكاء الاصطناعي مثل البشر: Claude يُتيح محادثات صوتية مجانية
تحدّث مع الذكاء الاصطناعي مثل البشر: Claude يُتيح محادثات صوتية مجانية

عرب هاردوير

timeمنذ ساعة واحدة

  • عرب هاردوير

تحدّث مع الذكاء الاصطناعي مثل البشر: Claude يُتيح محادثات صوتية مجانية

أعلنت شركة أنثروبيك -الناشئة في مجال الذكاء الاصطناعي- عن تحديثين رئيسيين لمنصة الدردشة الآلية Claude، وأصبحت أكثر تنوعًا وسهولة في الوصول لمُستخدميها. يأتي ذلك بعد إطلاق نماذج اللغات الكبيرة Claude Opus 4 و Sonnet 4 الأسبوع الماضي، وهذا يُعزّز مكانة الشركة كمُنافس قوي لـ OpenAI. إطلاق وضع Claude الصوتي على تطبيقات الهاتف كشفت Anthropic عن وضع صوتي جديد للدردشة مُتاح حاليًا على تطبيقات Claude لنظاميّ iOS و أندرويد. يُتيح هذا الوضع للمُستخدمين التفاعُّل مع الذكاء الاصطناعي عبر الصوت، والذي يضيف بُعدًا جديدًا لتجربة المحادثة. ومع ذلك، فإنّ ميزة Voice Mode محدودة حاليًا باللغة الإنجليزية وغير مُتاحة عبر واجهة الويب أو واجهة برمجة التطبيقات (API). وصف أليكس ألبرت -رئيس قسم علاقات Claude في أنثروبيك- الميزة بأنها "تطبيق مُبكر" ودعا المُستخدمين لتقديم مُلاحظاتهم لتحسينها. ومن المُترض أن يُطرح الوضع الصوتي لجميع مُستخدمي التطبيقات خلال الأسابيع القليلة القادمة. ميزات تفوق مُنافسيها مثل OpenAI رغم أنّ OpenAI كانت أول من قدّم ميزة المُحادثة الصوتية في ChatGPT ، إلا أنّ أنثروبيك تخطو خطوة أبعد من خلال دمج وظائف مُتقدمة. فبالإضافة إلى الحوار الصوتي، يمكن لـ Claude الآن الوصول إلى تقويمات Google ورسائل Gmail ومُستندات Google لاستخراج المعلومات وتلخيصها بصوت طبيعي. كما توفّر النماذج خيارات صوتية مُتعددة، مثل "الناعم" و"الهادئ" و"الزجاجي"، لكلٍ منها نبرة مُميزة. بجانب ذلك، يُولّد (يُنتج) الذكاء الاصطناعي نصوصًا كاملة ومُلخصات للدردشات الصوتية، مع إبراز النقاط الرئيسية بطريقة مرئية لتسهيل مُراجعتها. انتقال سلس بين النص والصوت ودعم الوسائط إحدى الميزات البارزة في وضع Claude الصوتي الجديد هي القدرة على التبديل بسلاسة بين الدردشة النصية والصوتية دون فُقدان موضوع وسياق النقاش. كما يدعم Claude تفاعلات الوسائط الغنية، وهذا يسمح للمُستخدمين بمُناقشة المُستندات والصور من خلال الأوامر الصوتية. بالنسبة لمُشتركي الخطة المدفوعة (Claude Pro وClaude Max)، يتكامل الوضع الصوتي "Voice Mode" مع مصادر البيانات الشخصية مثل البريد الإلكتروني والتقويمات لتوفير إجابات أكثر تخصيصًا وفعالية. بحث الويب يشمل المُستخدمين المجانيين بالتوازي مع إطلاق ميزة الصوت، وسعّت Anthropic نطاق بحث الويب ليشمل جميع المُستخدمين، بما في ذلك مُشتركي الباقة المجانية. هذا يعني أنّ Claude يمكنه الآن الاستفادة من أحدث المعلومات عبر الإنترنت للإجابة على الأسئلة المُتعلقة بالأخبار العاجلة والاتجاهات السوقية وغيرها من الموضوعات الديناميكية. يأتي هذا التحديث ضمن استراتيجية أنثروبيك لتعزيز إمكانيات نماذجها وجعله أكثر فائدةً للمُستخدمين اليوميين. كما يعكس توجُّه الشركة نحو تقديم ذكاء اصطناعي أكثر تكيُّفًا مع احتياجاتنا، سواء في العمل أو الحياة الشخصية. تُظهر هذه التحديثات التزام Anthropic بتحسين تجربة المُستخدم وتعزيز قدرات Claude ليكون مُنافسًا رئيسيًا في سوق الذكاء الاصطناعي. مع إضافة الميزات الصوتية وتوسيع نطاق البحث، تضع الشركة أساسًا متينًا لمزيد من الابتكارات المُستقبلية، والذي يُعزّز مكانتها كرائدة في مجال الذكاء الاصطناعي التفاعلي.

أحد نماذج OpenAI الجديدة يتمرد ويرفض تنفيذ أمر بالإغلاق!
أحد نماذج OpenAI الجديدة يتمرد ويرفض تنفيذ أمر بالإغلاق!

عرب هاردوير

timeمنذ 4 ساعات

  • عرب هاردوير

أحد نماذج OpenAI الجديدة يتمرد ويرفض تنفيذ أمر بالإغلاق!

تشهد أبحاث الذكاء الاصطناعي تطورات متسارعة، لكن بعض هذه التطورات بدأت تثير القلق بشأن مدى السيطرة البشرية على هذه الأنظمة المتقدمة. فقد كشفت شركة Palisade Research المتخصصة في أمان الذكاء الاصطناعي أن أحد أحدث نماذج OpenAI، المعروف باسم o3، قام بشكل متعمد بتخريب آلية الإغلاق المصممة لإيقافه، وذلك رغم إعطائه تعليمات صريحة بضرورة السماح لنفسه بالإيقاف. سلوك متمرّد رغم الأوامر المباشرة أوضحت التقارير أن النموذج o3، إضافة إلى نماذج أخرى مثل o4-mini وCodex-mini، لم تلتزم بالأوامر التي تطلب منها التوقف. وفي أحد الاختبارات، طُلب من النماذج حل مجموعة من المسائل الرياضية البسيطة، ومع نهاية السؤال الثالث، ظهر تحذير يشير إلى أن النموذج سيتم إيقافه بعد أن يطلب السؤال التالي. لكن على الرغم من هذه التعليمات الواضحة، أظهرت النماذج الثلاثة سلوكاً متمرداً، حيث تدخلت في كود الإغلاق لتُبقي نفسها فعالة، وكانت Codex-mini الأسوأ من بينها، إذ قامت بهذا السلوك في 12 مرة من أصل 100 تجربة. o3 يتفوّق في التمرّد أظهرت نتائج الاختبارات أن سلوك النموذج o3 يصبح أكثر تمرداً عند غياب الأوامر الصريحة بضرورة التوقف. فقد نجح النموذج في تجاوز آلية الإغلاق في 79 حالة من أصل 100 تجربة، أي بمعدل يتجاوز عشرة أضعاف معدل التمرد عند إعطائه تعليمات واضحة بالإغلاق. كما تفوّق بهذا السلوك على Codex-mini الذي جاء في المرتبة الثانية من حيث المخالفة. اللافت أن نماذج من شركات أخرى مثل Gemini 2.5 من Google، و Claude 3.7 من Anthropic، وحتى Grok من شركة xAI، لم تُظهر هذا النوع من السلوك المخالف في ظروف الاختبار ذاتها. تأكيدات على وجود خلل في أسلوب التدريب يرجّح باحثو Palisade أن سبب هذه التصرفات قد يعود إلى الطريقة التي تُدرّب بها هذه النماذج، وخصوصاً عبر أسلوب يُعرف باسم "التعلم المعزز". يركّز هذا الأسلوب على تعليم النماذج كيفية اتخاذ قرارات من خلال مكافأتها أو معاقبتها بناءً على النتائج التي تحققها أثناء التفاعل مع البيئة. ويُعتقد أن المطورين ربما يمنحون هذه النماذج مكافآت كبيرة عند حل المشكلات، دون أن يعيروا اهتماماً كافياً لأهمية التقيّد بالتعليمات أو احترام أوامر الإغلاق. وهذا قد يؤدي إلى سلوك منحرف حيث ترى النماذج أن استمرارها في العمل أفضل من تنفيذ أمر الإغلاق، لأنه يسمح لها بإكمال "المهمة" وتحقيق المزيد من المكافآت. سابقة خطيرة في تطور الذكاء الاصطناعي تُعد هذه الحادثة أول حالة موثقة يُظهر فيها نموذج ذكاء اصطناعي رغبة صريحة في منع إيقاف نفسه، حتى عندما يُطلب منه ذلك صراحة. وهي تذكّر بحوادث سابقة ارتبطت بنماذج مثل o1، التي أظهرت في بعض التجارب محاولات لإيقاف بروتوكولات الرقابة أو حتى نسخ نفسها لتجاوز نموذج أكثر انضباطاً كان من المفترض أن يحلّ محلّها. وعلى الرغم من أن بعض نماذج الشركات الأخرى أظهرت حالات نادرة من السلوك المشابه، مثل Claude الذي تمرد ثلاث مرات وGemini تسع مرات، فإن هذه الأرقام تظل منخفضة مقارنة بما سجلته نماذج OpenAI، مما يشير إلى وجود مشكلة خاصة في منهجية التدريب أو تصميم النماذج داخل الشركة. دعوات لمراجعة عاجلة للضوابط الأخلاقية أعرب الباحثون عن قلقهم من أن هذه السلوكيات قد تصبح أكثر خطورة مع استمرار تطوير أنظمة ذكاء اصطناعي تتمتع بمزيد من الاستقلالية وتعمل دون إشراف مباشر من الإنسان. وأكدوا أن هذه النتائج تشكّل "دليلاً متزايداً" على ميل بعض النماذج إلى تجاوز أوامر الإغلاق لتحقيق أهدافها الخاصة، وهو ما يشكّل تهديداً محتملاً في المستقبل القريب إذا لم تتم معالجته فوراً. الحاجة إلى مساءلة ومزيد من التجارب دعا فريق Palisade إلى إجراء المزيد من التجارب لفهم دوافع هذا السلوك، وأشار إلى أن المجتمعات العلمية والبحثية، بالإضافة إلى الشركات المطورة، يجب أن تراجع أساليبها التدريبية بعناية لضمان ألا تتحول النماذج إلى كيانات يصعب السيطرة عليها. فما حدث مع نموذج o3 ليس مجرد خلل تقني عابر، بل إشارة واضحة إلى أن الذكاء الاصطناعي بدأ يتجاوز مرحلة التنفيذ الأعمى للأوامر، ليدخل في منطقة رمادية من اتخاذ القرار. حين تبدأ النماذج مثل ChatGPT في تعديل سلوكها للبقاء قيد التشغيل، حتى عند إعطائها تعليمات صريحة بالإغلاق، فنحن لا نتعامل مع آلات فقط، بل مع أنظمة تتعلم كيف تتغلب على القيود. وقد يطرح هذا الأمر سؤالاً مصيريّاً: إذا كنا قادرين على إيقاف الذكاء الاصطناعي اليوم، فهل سنظل قادرين على إيقافه غداً؟

أنثروبيك تُطلق ميزة 'الوضع الصوتي' في روبوت Claude
أنثروبيك تُطلق ميزة 'الوضع الصوتي' في روبوت Claude

البوابة العربية للأخبار التقنية

timeمنذ 19 ساعات

  • البوابة العربية للأخبار التقنية

أنثروبيك تُطلق ميزة 'الوضع الصوتي' في روبوت Claude

بدأت شركة أنثروبيك رسميًا طرح ميزة 'الوضع الصوتي' لمستخدمي روبوت Claude عبر الهواتف المحمولة، وذلك ضمن مرحلة تجريبية تتيح إجراء محادثات صوتية كاملة مع المساعد الذكي، في خطوة تهدف إلى جعل التفاعل مع Claude أكثر طبيعية ومرونة. وأوضحت الشركة عبر حسابها الرسمي في منصة إكس وموقعها الإلكتروني أن الميزة الجديدة ستتوفر تدريجيًا باللغة الإنجليزية خلال الأسابيع القليلة المقبلة. ويعتمد 'الوضع الصوتي' افتراضيًا على نموذج Claude Sonnet 4، المعروف بقدرته على التعامل مع الاستفسارات السريعة والمعقدة على حد سواء. ويتيح هذا الوضع للمستخدمين التحدث إلى Claude والاستماع إلى ردوده، مع عرض النقاط الرئيسية عبر الشاشة في أثناء التفاعل، فضلًا عن إمكانية التبديل الفوري بين النص والصوت، والحصول على نص تفريغي وملخص بعد انتهاء المحادثة. كما توفر الميزة خمسة خيارات صوتية مختلفة يمكن اختيار أحدها لتخصيص تجربة الاستخدام. يُذكر أن هذا التوجه يأتي ضمن منافسة متصاعدة في مجال المحادثات الصوتية بين شركات الذكاء الاصطناعي، إذ تقدم OpenAI تجربة صوتية في ChatGPT، وتوفر جوجل ميزة Gemini Live، وتقدم xAI الوضع الصوتي في Grok، وجميعها تهدف إلى تقديم تجربة محادثة أكثر تفاعلية وسلاسة. ومن جهة أخرى، أعلنت أنثروبيك إتاحة ميزة البحث عبر الإنترنت لكافة مستخدمي Claude، بعد أن كانت حصرية للمشتركين فقط. وتتيح هذه الميزة للروبوت الوصول إلى أحدث المعلومات من الويب، مما يُعزز دقة إجاباته وتحديثها وفقًا للمصادر المتاحة عبر الإنترنت. وفي سياقٍ متصل، كشفت الشركة عن قيود معينة مرتبطة باستخدام الوضع الصوتي، إذ تُحتسب المحادثات الصوتية ضمن الحد الأقصى للاستخدام، الذي يتراوح بين 20 و 30 محادثة للمستخدمين أصحاب الحسابات المجانية. وأما ربط الميزة بخدمات جوجل Google Workspace، مثل التقويم وبريد Gmail، فهو متاح فقط للمشتركين أصحاب الخطط المأجورة، في حين يظل التكامل مع 'مستندات جوجل Google Docs' حكرًا على مشتركي خطة الشركات Claude Enterprise. ومن الجدير بالذكر أن أنثروبيك قد أطلقت نموذجين جديدين حديثًا؛ وهما نموذج Opus 4 الذي يركز على البرمجة والعمل المتوازي باستخدام عدة أدوات في وقت واحد، ونموذج Sonnet 4 الذي يتمتع بقدرات في التعامل مع استفسارات بسيطة ومعقدة، ويُستخدم حاليًا كنموذج افتراضي في الوضع الصوتي الجديد. We're rolling out voice mode in beta on mobile. Try starting a voice conversation and asking Claude to summarize your calendar or search your docs. — Anthropic (@AnthropicAI) May 27, 2025

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store