
'غوغل': ميزة جديدة لإنشاء الفيديو بالذكاء الاصطناعي
أعلنت غوغل عن أداة جديدة مخصصة لصناعة الفيديو تعتمد على الذكاء الاصطناعي باسم Flow، وهي مصممة لتبسيط إنشاء مقاطع قصيرة باستخدام نماذجها الحديثة، ومنها نموذج Veo 3 لتوليد الفيديو، ونموذج الصور المحسن Imagen 4.
وتتيح أداة Flow للمستخدمين إنشاء مقاطع فيديو مدتها 8 ثوان بالاعتماد على تعليمات نصية (text-to-video) أو باستخدام صور مرجعية إلى جانب النص، بهدف توجيه النموذج نحو النتيجة المرغوبة.
وتوفر Flow أدوات لتجميع المشاهد وربط المقاطع معا بطريقة سلسة، مما يجعلها أقرب إلى تطبيق لتحرير الفيديو، لكنه موجه بنحو خاص لإنتاج المحتوى بالذكاء الاصطناعي.
وفي السياق نفسه، كشفت غوغل في معرض Google I/O 2025 عن الجيل الثالث من نموذج Veo، الذي يتميز بجودة أعلى وقدرة محسنة على فهم التعليمات الطويلة وتسلسل الأحداث، فضلا عن إمكانية توليد مقاطع صوتية وحوارية مدمجة مع الفيديو، وأما الإصدار الثاني Veo 2، فسوف يحصل على أدوات تحكم في الكاميرا، وميزة إزالة العناصر غير المرغوبة من المشهد.
وفيما يتعلق بنموذج الصور الجديد Imagen 4، فقد بات قادرا على إنتاج صور بجودة أفضل، وتصديرها بعدة تنسيقات، كما أصبح أدق في كتابة النصوص الحقيقية داخل الصور، متفاديا التشوهات المعتادة في النماذج السابقة.
وتتوفر أداة Flow ابتداء من اليوم في الولايات المتحدة للمشتركين في باقتي Google AI Pro و Google AI Ultra، وتتيح الباقة الأولى 100 عملية توليد شهريا، في حين تمنح الباقة الثانية إمكانية الوصول المبكر إلى نموذج Veo 3 مع دعم إنتاج الصوت الأصلي في الفيديو.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الشرق السعودية
منذ 4 ساعات
- الشرق السعودية
جوجل تكشف عن أحدث نماذجها الذكية لإنشاء الصور ومقاطع الفيديو
كشفت شركة جوجل، خلال مؤتمرها السنوي للمطورين IO 2025، عن أحدث نماذجها الذكية لإنشاء الصور ومقاطع الفيديو، وكذلك الجيل الأول من عائلة نماذج متخصصة في إنشاء الأفلام الاحترافية تحت اسم Flow. قدمت الشركة نموذجيها Veo 3 للفيديوهات وImagen 4 للصور، مزودان بمزايا جديدة كلياً، إلى جانب إتاحة نموذجها لإنشاء الموسيقى Lyria 2. Veo 3 لإنشاء الفيديو يقدم Veo 3 قدرات متطورة على إنشاء مقاطع الفيديو التي ستكون مزودة لأول مرة بين نماذج Veo بمؤثرات صوتية تعزز من المحتوى البصري، إضافة إلى تقديم دقة أعلى في فهم مدخلات النصوص والصور التي تصف المشهد الذي يرغب المستخدم في إنتاجه، مع تطبيق قواعد الفيزياء للعالم الحقيقي بشكل منطقي، إلى جانب تقديم دقة فائقة في حركة شفاه الشخصيات البشرية عند التحدث داخل الفيديوهات المُنشأة، بحسب جوجل. وأشارت جوجل إلى تطور النموذج في مستوى فهم سياق الأحداث وتسلسلها، فمثلاً يمكن للمستخدم إدخال سرد قصصي بتفاصيل بصرية دقيقة، ويتمكن Veo 3 من فهمها وتحويلها إلى مشهد مصور. Google AI Ultra الجيل الجديد Veo 3 يتوفر للمشتركين في خدمة Google AI Ultra المدفوعة في الولايات المتحدة عبر تطبيق جيميناي، ومن خلال خدمة Flow لإنشاء الأفلام الاحترافية، وكذلك لقطاع الأعمال يتوفر عبر منصة Vertex AI. وأضافت جوجل تحديثات جديدة إلى نموذج Veo 2، تمثلت في إمكانية إدخال صور لشخصيات، أو مشاهد، أو عناصر، أو حتى أنماط مختلفة للملابس والديكور مثلاً، ليتمكن النموذج من الحفاظ على اتساق المقاطع المصورة بتفاصيل وأنماط متجانسة، إلى جانب القدرة على التحكم بدقة في حركة الكاميرا وزوايا التصوير للخروج بالرؤية المتوقعة للمشاهد. كما أضافت القدرة على توسيع كادرات المشاهد المصورة، بحيث يمكن تحويل أسلوب العرض الرأسي إلى أفقي بدقة، ما يجعل المقاطع سهل عرضها على أي شاشات، وذلك من خلال إضافة المزيد من التفاصيل إلى مشاهد بدقة لا تغير محتواها الأصلي. وأخيراً سيتمكن مستخدمو Veo 2 من إضافة وإزالة أي عناصر من المقاطع المصورة المُنشأة من خلاله، إلى جانب إمكانية التحكم في أحجامها وظلالها. المزايا الجديدة تصل Veo 2 من خلال منصة Vertex AI API للمطورين، وكذلك عبر خدمة Flow، وستصل إلى مزيد من الخدمات خلال الفترة المقبلة. نموذج Imagen 4 وكشفت جوجل عن نموذجها الجديد لإنشاء الصور Imagen 4، والذي يصل مع مجموعة من المزايا التي تركز على أدق التفاصيل، مثل طريقة تصميم أنسجة الأقمشة وقطرات المياه، وجلود وفرو الحيوانات. كذلك يتيح النموذج الجديد، بحسب جوجل، تقديم مستوى فريد من محاكاة أساليب التصوير الحقيقية للأشياء، والحفاظ على جودة فائقة في العرض، إذ يمكن إنتاج صور بدقة تصل إلى 2K وبمعاملات عرض مختلفة لتتناسب مع مختلف شاشات الأجهزة والأغراض المتنوعة، مثل العرض والطباعة. ويتوفر النموذج الجديد عبر خدمة جيميناي للويب وتطبيقات الهواتف الذكية، وكذلك منصات Whisk وVertex AI، إلى جانب خدمات Slides وVids وDocs داخل منصة Workspace. كما تعمل جوجل على تطوير إصدار فائق السرعة في إنتاج الصور من Imagen 4 سينجز مهمته بسرعة تصل إلى 10 أضعاف سرعة النموذج السابق Imagen 3. نموذج إنشاء الموسيقى Lyria 2 أتاحت جوجل نموذجها لإنشاء الموسيقى Lyria 2، الذي يسمح لصناع الموسيقى والفنانين بالاستفادة من أدوات متطورة لتحويل الأفكار إلى ألحان مبتكرة. النموذج الجديد متوفر لإنشاء الموسيقى لصناع المحتوى عبر منصة يوتيوب لإنشاء الفيديوهات القصيرة Shorts، وكذلك داخل منصة Vertex AI. كما سيتوفر النموذج الموسيقي عبر منصة Lyria RealTime إلى عموم المستخدمين، ليجربوا إمكانية إنشاء المقاطع الموسيقية المبتكرة عبر الذكاء الاصطناعي. نموذج Flow وقدمت جوجل نموذج Flow لإنشاء الأفلام بشكل احترافي سينمائي، وقد تمكنت من تحقيق هذا عبر دمج نماذجها المتطورة المختلفة، جيميناي وImagen وVeo، معاً. ويتيح النموذج الجديد للمستخدم كتابة أوامر نصية تتضمن التفاصيل المتعلقة بفريق العمل، وأماكن سير الأحداث، والعناصر، والأنماط المختلفة، وكذلك التحكم في أساليب وزوايا التصوير، والمعدات المستخدمة. تتوفر خدمة Flow للمشتركين في باقات Google AI Pro وGoogle AI Ultra داخل الولايات المتحدة، على أن يتم توسيع إتاحتها لمزيد من الدول حول العالم خلال الفترة المقبلة. رصد محتوى الـAI في الوقت الذي كشفت فيه الشركة عن نماذجها الجديدة لإنشاء محتوى بالذكاء الاصطناعي بمختلف أشكاله، تقدم جوجل منذ 2023 علامة مائية SynthID والتي تضعها في طيات أي محتوى من صور أو فيديوهات أو مقاطع موسيقية، ليتم إثبات أن المحتوى أنشئ عبر نماذجها الذكية، وذلك للتصدي لنشر الشائعات والمحتوى المضلل. كما كشفت الشركة في مؤتمرها عن أداة جديدة، وهي SynthID Detector والتي تسهل اكتشاف المحتوى المنشأ بواسطة أدوات الذكاء الاصطناعي، وذلك من خلال رفع المستخدم المحتوى الذي يرغب في التحقق منه إلى المنصة، عبر موقعها الرسمي، ليتم تأكيد أو نفي وجود علامة جوجل المائية داخل المحتوى.


Independent عربية
منذ 5 ساعات
- Independent عربية
هل حان الوقت ليصبح الروبوت زميلنا في العمل؟
بعد أن طرحت قبل ما يزيد عن خمسة أعوام كفرضية، نستطيع أن نقول اليوم إننا أصبحنا أقرب من أي وقت مضى إلى احتمال تجسيد علاقة الزمالة بين البشر والروبوتات، فبعد القفزات الأخيرة التي حققها التطور في النماذج اللغوية والمساعدين الرقميين أصبح بإمكان بعض نماذج الذكاء الاصطناعي إنجاز مهمات تتجاوز العالم الرقمي، ممتدة بتأثيرها وأفعالها على العالم المادي الحقيقي، فنحن على أعتاب إدخال الذكاء الاصطناعي إلى العالم المادي من خلال الروبوتات التي ما توقفت تجارب بنائها وتطويرها منذ الروبوت البدائي الأول "إيريك" Eric الذي أعلن عنه نهاية الربع الأول من القرن الماضي، مروراً ببداية الستينيات والوعود بروبوتات ستدمج في الحياة اليومية لإحداث تحولات إيجابية، وصولاً إلى عصر نشهد فيه اليوم تطورات مبهرة في مجال تدريب الروبوتات ومحاولة تأهيلها لتصبح بيننا وحولنا في العمل والمنزل وفي كل مكان، ولذلك على البشر أن يبدأوا بتقبل هذه الفكرة كواقع جديد قادم، وأن يستبشروا ويتفاءلوا بالمستقبل ويتعاونوا مع الآلات لاستغلالها بأفضل صورة ممكنة. تعميم المهمات وفي السياق توصلت "غوغل ديب مايند" حديثاً إلى نسخة من نموذجها للذكاء الاصطناعي "جيميناي روبوتكس" يمكن تسميتها بالهجينة، تجمع في عملها بين العالمين الرقمي والمادي معاً، وقادرة على تجاوز المهمات الرقمية التي اقتصرت سابقاتها على تأديتها والبدء في إنجاز المهمات على مستوى العالم المادي، وحققت "غوغل" هذه القفزة بالجمع بين أفضل نموذج لغوي كبير لديها "جيميناي 2.0" وعلم الروبوتات لتطوير روبوتات قادرة على التعميم أو الاستقراء، إذ يجري إصدار أوامر للروبوت ثم يقوم النموذج اللغوي الكبير بفلترة هذه الأوامر ليحدد النيات من خلال ما تقول، ثم يجزئها إلى أوامر يمكن للروبوتات تنفيذها. ونجد هنا أن استخدام النموذج اللغوي الكبير، وهو نوع من نماذج التعلم الآلي المصممة لمهمات معالجة اللغة الطبيعية، جعل الروبوتات أكثر براعة وقدرة على فهم الطلبات البشرية والتواصل باستخدام أوامر اللغة الطبيعية والتعميم على أنواع مختلفة من المهمات، أي قدرة نموذج الذكاء الاصطناعي على تطبيق المعرفة أو المهارات المكتسبة من نوع مهمة معينة على مهمة مختلفة ولكنها ذات صلة. وفي حين حقق الذكاء الاصطناعي تقدماً في مختلف المجالات ظلت الأمور السابقة تشكل صعوبة لدى الروبوتات للقيام بها، إذ قال المتخصصون سابقاً أن أحد أسباب ندرة وجود روبوتات مفيدة في كل مكان هو أن الروبوتات كانت تقدم أداء جيداً في حال أخضعت لسناريوهات واجهتها سابقاً، في حين كانت تفشل في السيناريوهات غير المألوفة أو التي لم تتطلع عليها سابقاً، أي تفشل في تعميم التجربة. التفكير المكاني وإضافة إلى ذلك كان التفكير المكاني يشكل تحديداً حقيقياً أمام منشئي النماذج اللغوية، حتى استطاعت عملية الدمج هذه بين قوة النماذج اللغوية الكبيرة والتفكير المكاني رفع قدرات الروبوتات ودقة إنجازها لمهماتها في الواقع المادي، ويعرف التفكير المكاني بأنه القدرة على إدراك العلاقات المكانية بين الأشياء أو القدرة على التصور البصري للأشكال في الفراغ والتعامل مع الشكل والحجم والتوجيه والموقع والاتجاه، أي توليد الصور البصرية والاحتفاظ بها واسترجاعها، إذ يستهدف موقع وحركة الأجسام من حولنا من خلال تصورها ذهنياً أو حسياً، ويتضمن التفكير المكاني القدرة على التعامل مع المعلومات التي تقدم في صورة رمزية أو بيانية أو بصرية مقارنة بالمعلومات ذات الطابع اللغوي، كما أن التفكير المكاني واحد من مصادر حل المشكلات، إذ يختص بالقدرة على حل المشكلات المكانية من خلال فهم ماهية الأشكال ثنائية وثلاثية الأبعاد والعلاقات بينها، وهي صفة يتمتع بها البشر بصورة عامة، وإن كانت نسبتها متفاوتة بين شخص وآخر، فالأفعال اليومية البسيطة التي تكاد لا تلحظ ويقوم بها البشر، كانت في الحقيقة غاية في الصعوبة على الروبوتات في وقت مضى، وإن كانت لا تزال في طور التدريب والنجاح والفشل إلا أنها قطعت شوطاً طويلاً إلى أن وصلنا إلى مكان أصبحت فيه الروبوتات أكثر قدرة على التعامل مع المكان وفهم اللغة الطبيعية وتقدير المسافات واتخاذ القرارات الصائبة، وإن كان التنفيذ لا يزال بطيئاً. اقرأ المزيد يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field) بيانات التدريب والبشر يتمتعون بقدرات تفكير مكاني متخصصة وعالية الكفاءة لم تتمكن النماذج حتى الآن من محاكاتها، على رغم أن المحاولة بقيت مستمرة مع كل إصدار جديد من النماذج سواء "جي بي تي" و"جيميناي" وغيرها، إذ يجري تحسين قدرات التفكير المكاني من خلال التدريب المتخصص من جانب مزودي خدمات الذكاء الاصطناعي، والحقيقة أن سباق الروبوتات كله قائم على المنافسة المفتوحة والمحتدمة على بيانات التدريب التي يمكن تشبيهها بعملة النماذج اللغوية، والتي يمكن اعتبارها محرمة في بعض الأحيان، إذ إن الحصول عليها يعني الوقوف على مجموعة من الأسئلة الأخلاقية والقانونية على حد سواء. والحقيقة أن نقص الوصول إلى البيانات المستخدمة في تدريب وتمكين الروبوتات من التفاعل بسلاسة أكبر مع العالم المادي يبطئ التطور في هذا المجال، وفي حين خلق وجود "شات جي بي تي" بيننا تفاعلاً مباشراً مع أدوات الذكاء الاصطناعي، لكن التفاعل مع الروبوتات ليس كذلك، بل يكاد يكون نادراً على مستوى الأفراد والعامة. انعطافه جديدة وفي حين يتعلم البشر من خلال الملاحظة والتجربة والخطأ، تتعلم الروبوتات من العالم المادي عبر المعادلات والبرمجة، وهي طريقة بطيئة، والأهم أنه لم يكن بإمكانها تعميم المهارة المكتسبة لنقلها من مهمة إلى أخرى، فقد دُربت الروبوتات عقوداً طويلة على مهمات محددة ومحدودة في حيّز المكان، لكن اليوم وبفضل التطورات المتلاحقة في هذا المجال فنحن على أعتاب تحول ترأسه قدرة الروبوتات الحالية على التعلم من خلال البيانات، ولقد بدأت الروبوتات بتعليم نفسها بالفعل، وبالتالي نحن أمام تقدم أسرع وآلات ذات قدرات يمكن تعميمها، ويبدو أننا على أبواب انعطافه جديدة قد تغير شكل تعاملاتنا مع الروبوتات بخاصة، فتقنيات الذكاء الاصطناعي ستجعل بين أيدينا روبوتات أكثر قدرة على التفاعل مع البيئة والقيام بمهمات كان من غير الممكن القيام بها سابقاً، نظراً إلى محدودية تعاملها مع البيئة أو المكان. الذكاء الاصطناعي المادي شهدنا هذا العام عودة شركات الذكاء الاصطناعي لبناء الروبوتات، فأعلنت شركة "إنفيديا" عن الموجة الجديدة للذكاء الاصطناعي مطلقة عليها اسم "الذكاء الاصطناعي المادي"، وتعمل شركات عدة مثل "فيغير أيه آي"figure AI و"أجيليتي روبوتكس" Agility Robotics على بناء منشآت ضخمة الإنتاج لتصنيع آلاف الروبوتات الشبيهة بالبشر سنوياً، وأصبحنا نرى خلال الفترة الأخيرة عروضاً لروبوتات ذات هيئة شبيهة بالبشر تقوم بتنفيذ أوامر حركية تتطلب مهارات تفكير وبراعة بدنية، ووعياً بالمكان والأشياء والأبعاد، وقدرة على محاكاة طريقة قيام البشر بهذه المهمات، وإذاً نحن هنا أمام دمج الذكاء الاصطناعي في عالم الروبوتات، لكن هذا لا يعني أنها ستتوافر بيننا في القريب العاجل، إذ تمر هذه الروبوتات بمرحلة تدريب واختبار، إضافة إلى التأكد من تحقيقها معايير السلامة الصناعية، فضلاً عن أن هذه الروبوتات يجري اختبارها ضمن مساحات شاسعة وفارغة، في حين يتطلب وجودها بيننا في المنازل والمكاتب توفير مساحة مناسبة للتحرك والعمل، أي أن الأمر ليس بهذه البساطة التي يتصورها بعضهم.


الوئام
منذ 7 ساعات
- الوئام
غوغل تختبر إدراج الإعلانات بـ'الوضع الذكي' في نتائج البحث
أعلنت شركة 'غوغل'، اليوم الأربعاء، عن خططها لإدراج الإعلانات ضمن تجربة 'الوضع الذكي' (AI Mode) المدعومة بالذكاء الاصطناعي في محرك البحث، وذلك في خطوة تجريبية تستهدف دمج الإعلانات ضمن الردود التي يتم توليدها آليًا. ذكرت الشركة أن الإعلانات ستُعرض 'عند الاقتضاء'، سواءً أسفل الردود أو ضمن محتواها، مشيرةً إلى أن 'الوضع الذكي' يتيح للمستخدمين طرح الأسئلة والحصول على إجابات مولّدة بواسطة الذكاء الاصطناعي، مع إمكانية التوسّع من خلال استفسارات لاحقة وروابط لمصادر خارجية. وأوضحت غوغل في منشور رسمي: 'على سبيل المثال، إذا كانت الإجابة تتضمن اقتراحًا بإنشاء موقع إلكتروني، فقد نعرض إعلانًا يساعد المستخدم على بدء هذه الخطوة'. وأضافت: 'من هناك يمكنه متابعة الاستفسارات حول أفكار المشاريع أو أنواع المحتوى المناسبة أو حتى الجمهور المستهدف'. وتسعى الشركة، وفق 'Tech Crunch'، إلى استثمار 'الوضع الذكي' كامتداد لإعلاناتها التي تمثل المصدر الرئيسي لإيراداتها، إذ حققت غوغل أكثر من 66.8 مليار دولار من الإعلانات خلال الربع الأول من عام 2025 فقط. لكن هذا التوجّه قد يواجه رفضًا من المستخدمين، حيث أظهرت دراسة حديثة أجرتها 'CivicScience' أن 36% من البالغين في الولايات المتحدة سيقلّ احتمال شرائهم من علامات تجارية تستخدم الذكاء الاصطناعي في الإعلانات. وبحسب البيان، فإن المعلنين الذين يستخدمون حملات 'Performance Max' و'Shopping' و'Search' مع خاصية 'المطابقة الواسعة' سيكونون مؤهلين لظهور إعلاناتهم في 'الوضع الذكي'، حيث ستُعرض حاليًا إعلانات البحث والتسوّق ضمن نتائج البحث على سطح المكتب والأجهزة المحمولة داخل الولايات المتحدة. وفي موازاة ذلك، كشفت غوغل عن توسيع نطاق الإعلانات ضمن ميزة 'الملخصات الذكية' (AI Overviews)، وهي ميزة تلخص الإجابات مباشرة ضمن نتائج البحث. وستبدأ الشركة بعرض إعلانات البحث والتسوّق على أجهزة الكمبيوتر المكتبي في الولايات المتحدة، تمهيدًا لتوسيع النطاق ليشمل 'دولًا مختارة' بلغات متعددة على الهاتف وسطح المكتب. وأشارت غوغل إلى أن الإعلانات ستُدمج في هذه الملخصات عندما تكون ذات صلة بالاستفسار والمحتوى المقدم، وستُعرض تحت تصنيف 'إعلان ممول' (Sponsored). ويُذكر أن غوغل بدأت عرض الإعلانات ضمن 'الملخصات الذكية' عبر الهواتف المحمولة في الولايات المتحدة منذ أكتوبر الماضي. وتأتي هذه التحركات في ظل قلق متزايد من الناشرين، الذين يخشون من تأثير هذه المزايا الجديدة على عائداتهم الإعلانية، خاصةً مع اعتماد المستخدمين بشكل متزايد على الأجوبة المختصرة التي يقدمها الذكاء الاصطناعي دون زيارة المواقع الإخبارية. وقدر خبير نقلت عنه صحيفة 'نيويورك بوست' أن اعتماد هذه التقنية قد يسبب خسائر تتجاوز 2 مليار دولار للناشرين نتيجة تراجع مشاهدات الإعلانات. وفي المقابل، أكدت غوغل أنها تأخذ بعين الاعتبار مخاوف الناشرين أثناء تطوير تجارب البحث الذكية ومنتجاتها الإعلانية المرتبطة بها.