
"أدوبي" تطلق إصداراً جديداً من نماذج الذكاء الاصطناعي التوليدي للصور
أطلقت شركة البرمجيات الأمريكية أدوبي أحدث إصدارات عائلة نماذج الذكاء الاصطناعي التوليدي للصور فاير فلاي.
كما أعادت تصميم تطبيق فاير فلاي للويب الذي يتضمن كل نماذج الذكاء الاصطناعي الخاص بالشركة إلى جانب نماذج الذكاء الاصطناعي من الشركات المنافسة.
وتقول أدوبي إن النموذج الجديد فاير فلاي إيمدج موديل 4 أفضل من الإصدارات السابقة من حيث جودة الصور وسرعة التوليد وقدر التحكم في هيكل ونمط المخرجات، وزوايا الكاميرا وتكبير وتصغير العناصر. كما يمكنه توليد صور بشدة وضوح تبلغ 2 كيلو بكسل.
كما يوجد إصدار معدل من هذا النموذج يسمى إيمدج موديل 4 ألترا، يمكنه معالجة المشاهد المعقدة التي تحتوي على هياكل صغيرة والكثير من التفاصيل.
وقال ألكساندرو كوستن نائب رئيس أدوبي للذكاء التوليدي، إن الشركة دربت النماذج الجديدة باستخدام نظام حوسبة أقوى لتعزيز قدرتها على توليد صور بقدر أكبر من التفاصيل.
وأضاف أنه مقارنة بالنماذج السابقة، فإن النماذج الجديدة تحسن القدرة على توليد النصوص في الصور، وتحتوي على خصائص تسمح للمستخدمين باستخدام صور من اختيارهم للحصول على النموذج لتوليد الصور بهذا النمط.
في الوقت نفسه أطلقت أدوبي إصدار توليد الفيديوهات من نموذج الذكاء الاصطناعي فاير فلاي للاستخدام العام، بعد أن أطلقت نسخة تجريبية محدودة منه في العام الماضي.
ويتيح الإصدار الجديد توليد لقطات فيديو بالأمر النصي أو الصورة، مع استخدام زوايا الكاميرا وتحديد بداية ونهاية كل إطار للصور المتتابعة بهدف التحكم في اللقطات، وتوليد عناصر مناخية، وتخصيص عناصر تصميم الحركة. ويستطيع النموذج توليد لقطات فيديو باستخدام أوامر نصية بدرجة وضوح تبلغ 1080 بكسل.
وأعادت أدوبي تصميم تطبيق فاير فلاي للويب، ليتيح للمستخدم الوصول إلى كل نماذج الذكاء الاصطناعي الخاصة بالشركة إلى جانب عدد من نماذج الذكاء الاصطناعي لتوليد الصور والفيديوهات من شركات أخرى مثل جي.بي.تي لوليد الصور من أوبن أيه.آي وإيمدجن3 وفيو 2 من جوجل وفلوكس1ر1 برو من فلوكس. ويمكن للمستخدمين التبديل بين أيٍّ من هذه النماذج في أي وقت، كما سيرفق كل نموذج بيانات اعتماد المحتوى الخاص بالصور المُولَّدة من النموذج.
ولمّحت الشركة إلى إمكانية إضافة نماذج ذكاء اصطناعي أخرى إلى تطبيق الويب مستقبلًا. وأوضحت الشركة أن هذه النماذج الجديدة ستُدمج قريبًا في مجموعة منتجاتها، لكنها لم تُحدد موعدًا لإطلاقها.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


البوابة العربية للأخبار التقنية
منذ ساعة واحدة
- البوابة العربية للأخبار التقنية
جوجل تعيد تصميم محرك بحثها بوضع الذكاء الاصطناعي AI Mode
كشفت شركة جوجل، خلال مؤتمرها السنوي للمطورين Google I/O 2025 عن خطط شاملة لإعادة تصميم محرك بحثها ليعمل بطريقة تحاكي أسلوب التفاعل مع روبوتات المحادثة المعتمدة على الذكاء الاصطناعي، في خطوة تهدف إلى مجاراة المنافسة المتصاعدة من شركات مثل OpenAI وأنثروبيك. وبدايةً من اليوم، سيتمكن كافة المستخدمين في الولايات المتحدة من تفعيل ما يُعرف بـ 'وضع الذكاء الاصطناعي AI Mode' في نتائج البحث في جوجل ومتصفح كروم، ليحصلوا على تجربة تفاعلية تعتمد على نمط الأسئلة والأجوبة، بدلًا من عرض تقليدي للنتائج في صورة روابط، ومن المقرر توسيع إطلاق تلك الميزة لكافة المستخدمين حول العالم خلال الأشهر المقبلة. ووصف ساندار بيتشاي، الرئيس التنفيذي لشركة ألفابت مالكة جوجل، هذا التحديث بأنه 'إعادة تصور كاملة لتجربة البحث'، مؤكدًا أن هذه الخطوة تأتي ضمن جهود الشركة لإدماج تقنيات الذكاء الاصطناعي التوليدي في خدماتها الأساسية. ويُعد 'وضع الذكاء الاصطناعي AI Mode' امتدادًا لتقنية 'مطالعات البحث المدعومة بالذكاء الاصطناعي AI Overviews' التي أعلنتها جوجل خلال المؤتمر ذاته العام الماضي، والتي وفّرت إجابات مختصرة حول مواضيع شائعة. ومع انتشارها بين أوساط المستخدمين، أدت هذه الميزة إلى انخفاض ملحوظ في معدل النقر على الإعلانات، وتحويل الزوار إلى المواقع، مما أثار قلق المستثمرين وأصحاب المواقع على حدٍ سواء. وتواجه جوجل انتقادات بشأن تباطؤها في إطلاق تقنيات الذكاء الاصطناعي، مع أنها من أولى الجهات التي طوّرت الأبحاث التأسيسية في هذا المجال. وقد أتاح هذا التأخر الفرصة أمام شركات ناشئة مثل OpenAI وأنثروبيك للنمو وتحقيق تقييمات مالية بمليارات الدولارات، مهددةً هيمنة جوجل في مجال البحث عبر الإنترنت. وأشار بيتشاي إلى أن جوجل ما زالت تحتفظ بأفضلية كبرى في سوق البحث عبر الإنترنت، إذ تتلقى يوميًا نحو 8.5 مليارات استعلام بحثي. وفي المقابل، التزمت الشركة الصمت حيال كيفية إدماج الإعلانات في تجربة البحث الجديدة المعتمدة على الذكاء الاصطناعي، علمًا بأن إيرادات إعلانات البحث وحدها بلغت 50 مليار دولار في الربع الأول من عام 2025، أي أكثر من نصف الإيرادات الإجمالية لشركة ألفابت.


البوابة العربية للأخبار التقنية
منذ 2 ساعات
- البوابة العربية للأخبار التقنية
جوجل تكشف عن تطورات مشروع Astra لبناء مساعد ذكي شامل
كشفت جوجل خلال مؤتمر Google I/O 2025 عن التقدم الكبير الذي أحرزته في مشروع Astra، الذي تسعى من خلاله إلى تطوير مساعد ذكي شامل متعدد الوسائط، قادر على فهم العالم المحيط والتفاعل معه بلغة طبيعية، ضمن رؤيتها لتحويل تطبيق Gemini إلى مساعد شخصي متكامل. وكانت الشركة قد قدّمت أول عرض تجريبي لمشروع Astra في نسخة العام الماضي من المؤتمر، بوصفه نموذجًا بحثيًا يقدّم إجابات عن البيئة المحيطة في الوقت الفعلي. وأما اليوم، فقد أصبح المشروع أكثر نضجًا مع تحسينات ملحوظة، من أبرزها توسيع نطاق الذاكرة الزمنية للمساعد، وإضافة قدرات للتحكم في الحاسوب، مما يسمح له بأداء مهام أكثر تعقيدًا. واستعرضت جوجل في فيديو جديد القدرات الجديدة المطوّرة للمشروع، إذ أظهر المساعد قدرة على تصفح الويب، واستخراج معلومات دقيقة لتنفيذ المهام المعقّدة، مثل البحث في الرسائل الإلكترونية لاستخلاص مواصفات دراجة ما، والتواصل مع متجر محلي للحصول على قطعة بديلة لها. وقال ديميس هاسابيس، المدير التنفيذي لشركة ديب مايند DeepMind، إن طموح جوجل هو تحويل Gemini إلى مساعد ذكي شامل قادر على تنفيذ المهام اليومية، والتعامل مع التفاصيل الإدارية المملة، واقتراح محتوى ملهم، بما يثري حياة المستخدمين، ويزيد إنتاجيتهم. وأضاف أن هذه الرؤية بدأت تتبلور من خلال مشروع Astra، الذي يجمع بين قدرات فهم الفيديو، ومشاركة الشاشة، والذاكرة. وأشار هاسابيس أيضًا إلى أن جوجل تعمل على إدماج هذه القدرات في أجهزة قابلة للارتداء، مثل النظارات الذكية، وهي فكرة كانت قد ظهرت لمحة منها في عرض العام الماضي، وتبدو الآن أقرب إلى الواقع، في ظل إعلان الشركة مشاريع متقدمة في مجال الواقع الممتد (XR) خلال المؤتمر نفسه. ولا توجد مواعيد محددة لإطلاق هذه المزايا، لكن إشارات جوجل المتكررة تؤكد أنها تُراهن على إدماج الذكاء الاصطناعي في أشكال استخدام جديدة خلال العام الجاري.


عرب هاردوير
منذ 3 ساعات
- عرب هاردوير
هل نعيش عصر 'الذكاء الاصطناعي العبقري'؟ تحليل قدرات Gemini 2.5 الجديدة
أبرز ما أعلنته جوجل هو إضافة وضع Deep Think التجريبي، الذي يُعد نقلة نوعية في قدرات النموذج على مُعالجة المسائل الرياضية المُعقدّة والبرمجة المُتقدمة. يعتمد هذا الوضع على تقنيات بحث مُتطورة تسمح للنموذج بتحليل فرضيات مُتعددة قبل تقديم الإجابة، والذي يرفع دقته في المهام التي تتطلّب تفكيرًا عميقًا. أداء مُتميز في الاختبارات حقق Deep Think ما قدره 84⁒ في اختبار MMMU للاستدلال مُتعدد الوسائط (صوت، صور، فيديو)، وهو أحد المعايير الصعبة التي تقيس الفهم الشامل عبر تخصصات متنوعة. أظهر نتائج "مُبهرة" في أولمبياد الرياضيات الأمريكي (USAMO 2025)، رغم عدم الكشف عن النتيجة الدقيقة. يتصدّر حاليًا قائمة LMArena وWebDev Arena، وهو ما يؤكّد تفوقه في البرمجة وتطوير الويب. ميزات جديدة لتحسين الكفاءة ميزانيات التفكير: تتيح للمُطورين التحكم في تكلفة التشغيل عبر موازنة سرعة الاستجابة وجودة المُخرجات، مع تحسين استخدام الأكواد البرمجية بنسبة تصل إلى 30⁒. نافذة سياقية بمليون رمز: تدعم التعلُّم العميق عبر LearnLM، وهي مجموعة نماذج مُطوّرة بالشراكة مع خبراء تعليميين. جوجل تُجري تقييمات سلامة مُتقدمة قبل الإتاحة العامة، مع إتاحة الوضع حاليًا لمختبرين موثوقين عبر API. Gemini 2.5 Flash: تحسينات كبيرة بأقل تكلفة ركّزت جوجل على تعزيز كفاءة النموذج المخصص للمهام السريعة مُنخفضة التكلفة، حيث حقق: تحسنًا ملحوظًا في المنطق والبرمجة والسياق الطويل، مع تقليل استخدام الرموز بنسبة 20-30⁒. 12.1⁒ في اختبار HLE (Humanity's Last Exam)، ليحتل المرتبة الثانية بعد نموذج O4-mini من OpenAI (14.3⁒). سيتوفر للإنتاج العام بداية يونيو عبر Google AI Studio و Vertex AI. تحديثات الصوت: محادثات أكثر تعبيرًا وواقعية أطلقت جوجل ميزات صوتية مُبتكرة في واجهة Live API، تشمل: تخصيص النبرة والأسلوب: مثل جعل النموذج يروي القصص بنبرة درامية أو كوميدية. الحوار العاطفي: يستجيب لمشاعر المستخدم عبر تحليل نبرة الصوت. إلغاء ضوضاء الخلفية: لتحسين جودة التفاعل في البيئات الصاخبة. تحويل النص إلى كلام مُتعدد المتحدثين: يدعم 24 لغة مع إمكانية التبديل بينها بسلاسة، بما في ذلك نبرات الهمس والتأكيد. تحديثات إضافية للمُطورين Project Mariner: وكيل الذكاء الاصطناعي لتصفح الويب، سيتوسع نطاق اختباره الصيف القادم. دعم بروتوكول MCP من Anthropic: لدمج أدوات الذكاء الاصطناعي المفتوحة المصدر. مُلخصات الأفكار (سلسلة الأفكار): ستُضاف إلى واجهات Gemini API وVertex AI لتحليل المسائل المُعقّدة خطوة بخطوة. مع هذه التحديثات، تؤكّد جوجل مكانتها الرائدة في سباق الذكاء الاصطناعي، حيث تجمع بين القوة الحسابية لنماذج مثل Deep Think والكفاءة في Flash، مع تحسينات غير مسبوقة في التفاعل الصوتي والأمان. يُتوقع أن تُحدث هذه الترقيات تحولًا في قطاعات مثل التعليم والبرمجة والخدمات الصوتية، مع إتاحة أدوات أكثر تخصيصًا للمُطورين. جوجل لا تكتفي بالمُنافسة، بل تُعيد تعريف معايير الذكاء الاصطناعي عمليًا وأكاديميًا.