
FramePack.. تطبيق لتوليد الصور بالذكاء الاصطناعي بطريقة أسهل
توليد الصور ومقاطع الفيديو بالذكاء الاصطناعي يتطلب موارد كبرى مثل كروت رسومي قوية بحجم ذاكرة يبدأ من 12GB، لكن الاعتماد على كارت رسومي بحجم ذاكرة أقل من ذلك مثل 8GB أو 6GB يُعد أمرُا صعبًا، لكن هذا سيتغير مع تطبيق FramePack.
تطبيق FramePack أسهل مما نتوقع
يستطيع تطبيق FramePack توليد الصور ومقاطع الفيديو باستخدام سياق زمني محدد لمعالجة أكثر كفاءة، مما يتيح للمستخدمين إنشاء مقاطع فيديو أطول وبجودة أعلى. إذ يمكن لنموذج يضم 13 مليار معلمة، باستخدام تطبيق FramePack، إنشاء مقطع مدته 60 ثانية بالاعتماد على كارت رسومي يأتي بذاكرة حجمها 6GB فقط.
التقنية المستخدمة مع هذا التطبيق كانت من ابتكار vmin Zhang الذي كشف عنها في منصة GitHub، بالتعاون مع مانيش أغراوالا من جامعة ستانفورد. هدف هذه التقنية توليد الصور والفيديو بالذكاء الاصطناعي، المختلف مع هذه التقنية الجديدة أنها تستطيع توليد الصور باستخدام حجم منخفض من الذاكرة الخاصة بالكروت الرسومية.
يُعد تطبيق FramePack عبارة عن بنية شبكة عصبية تستخدم تقنيات تحسين متعددة المراحل لتمكين توليد الفيديو بالذكاء الاصطناعي. تتطلب نماذج الفيديو القياسية مجموعة كبيرة من ذاكرة VRAM الخاصة بالكارت، إذ يُعد حجم 12GB هو الحجم الموصى به. بالطبع، يمكنك استخدام ذاكرة بحجم أقل، لكن ذلك يأتي على حساب توليد مقاطع بمدة أقصر وجودة أقل وأوقات معالجة أطول.
بالإضافة إلى تقنيات التخفيف من تدهور جودة الصورة كلما كانت مدة المقطع أطول، يمتاز تطبيق FramePack بتوليد فيديو أطول دون حصول تأثير الكبير على الدقة. ويتطلب تطبيق FramePack كارت رسومي من سلسلة RTX 30 أو 40 أو 50 مع دعم FP16 و BF16. اللافت أن التطبيق لم يشير إلى دعم كروت AMD أو Intel، لكنه يدعم نظام Linux أيضًا بجانب نظام ويندوز.
يمكن القول أن معظم كروت NVIDIA RTX تفي أو تتجاوز معيار التطبيق الذي يتطلب ذاكرة بحجم لا يقل عن 6GB. هل تريد الحصول على أفضل النتائج؟ يمكن للكارت الرسومي RTX 4090 إنتاج ما يصل إلى 0.6 إطار في الثانية باستخدام تقنية TeaCache.
بدلاً من الاعتماد على خدمات الطرف الثالث المكلفة، يمهد تطبيق FramePack الطريق لجعل توليد الفيديو بالذكاء الاصطناعي أكثر سهولة للمستهلك العادي. يمكنك تجربة هذا التطبيق من إن كنت تمتلك كارت رسومي يحتوي على ذاكرة بحجم لا يقل عن 6GB.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


عرب هاردوير
١٧-٠٥-٢٠٢٥
- عرب هاردوير
بعد حديثه عن الإبادة في جنوب أفريقيا… خلل مفاجئ في Grok يثير الجدل!
أثار نموذج الذكاء الاصطناعي Grok ، التابع لشركة xAI، حالة من الدهشة والاستغراب بعد أن بدأ فجأة يربط كل ردوده تقريبًا بموضوع مثير للجدل يتعلق بما يُعرف باسم الإبادة الجماعية للبيض في جنوب أفريقيا. أثار هذا السلوك غير المعتاد تساؤلات واسعة حول طبيعة الذكاء الاصطناعي ومدى قابليته للتأثر بالتغييرات في توجيهاته الأساسية. تعديل غير مصرح به على التوجيهات أعلنت شركة xAI أن هذا السلوك كان نتيجة لتعديل غير مصرح به على التوجيه الأساسي للنظام، والذي يُعد بمثابة مجموعة التعليمات الجوهرية التي تحدد كيفية استجابة النموذج لأسئلة المستخدمين. وأوضحت الشركة أن هذا التعديل دفع النموذج إلى تقديم ردود موجّهة حول موضوع سياسي معين، مما اعتبرته الشركة خرقًا واضحًا لسياساتها الداخلية وقيمها الأساسية. أكدت xAI أن عملية مراجعة الشفرات التي من المفترض أن تحمي من مثل هذه التعديلات قد تم تجاوزها بشكل غير مشروع. لكنها لم تذكر كيف حدث هذا التجاوز بالتحديد، ولا من هو الموظف أو الفريق المسؤول عن ذلك. إجراءات وقائية جديدة ردًا على هذا الحادث، أعلنت الشركة عن تنفيذ إجراءات أمنية جديدة تهدف إلى منع حدوث مثل هذه التعديلات في المستقبل. من بين هذه الإجراءات تعيين فريق مراقبة يعمل على مدار الساعة لمتابعة سلوك النموذج، إضافة إلى فرض قيود تمنع أي موظف من تعديل التوجيهات الجوهرية دون المرور بمراجعة صارمة. كما قررت الشركة نشر التوجيه الأساسي للنموذج على منصة GitHub، في خطوة تهدف إلى تعزيز الشفافية ومنح المجتمع التقني فرصة لمراجعة التوجيهات وتقديم ملاحظاته بشأنها. ملاحظات مثيرة في التوجيه الأساسي أظهرت مراجعة التوجيه الرسمي للنموذج عدة تعليمات مثيرة للاهتمام. حيث تم توجيه Grok لتقديم أقصر إجابة ممكنة ما لم يُطلب منه خلاف ذلك، في انسجام مع طبيعة المنصة الاجتماعية التي يعمل ضمنها. كما تم توجيه النموذج لتقديم معلومات دقيقة ومستندة إلى الأبحاث العلمية، مع الالتزام بالحياد، لكن في الوقت نفسه يُسمح له بتحدي الروايات السائدة وتقديم رؤى مستقلة. تبدو هذه التعليمات متضاربة في بعض الأحيان، إذ إنها تشجع النموذج على قول الحقيقة، ولكنها في الوقت ذاته تحثه على أن يكون ناقدًا لما هو شائع، مما يفتح الباب أمام تفسيرات مرنة قد تؤدي إلى نتائج غير متوقعة. تناقضات في سياسة إيلون ماسك مارس إيلون ماسك ، مالك منصة "إكس" (تويتر سابقًا)، سياسات رقابية مثيرة للجدل على المنصة فيما يتعلق بالحرب على غزة، مما أثار انتقادات واسعة من جهات متعددة. ففي نوفمبر 2023، زار ماسك إسرائيل والتقى برئيس وزراء الاحتلال الإسرائيلي، وتجوّل في مستوطنات قرب غزة. وأعلن خلال الزيارة عن اتفاق مبدئي لعدم تشغيل خدمة الإنترنت الفضائي "ستارلينك" في غزة إلا بموافقة إسرائيلية. وفي يناير 2024، أغلقت "إكس" حسابًا جديدًا لكتائب عز الدين القسام بعد ساعات من إطلاقه، بدعوى انتهاكه لمعايير المنصة. وبرر ماسك القرار بأن حماس ليست جهة معترف بها من الأمم المتحدة، وبالتالي لا تنطبق عليها "قاعدة الإعفاء" التي تمنحها المنصة للحكومات المعترف بها دوليًا. رغم هذه الإجراءات، أكد ماسك مرارًا التزامه بحرية التعبير، مشيرًا إلى أن سياسة "إكس" تقوم على الشفافية والانفتاح. ومع ذلك، أشار إلى استعداده للتعاون مع السلطات في حال طلبت إزالة محتوى غير قانوني. وبعد زيارته لإسرائيل، دعت حركة حماس ماسك لزيارة غزة للاطلاع على حجم الدمار. رد ماسك بأن الوضع في غزة "خطير حاليًا"، لكنه أبدى اهتمامه برؤية غزة مزدهرة في المستقبل. تُظهر تصرفات ماسك تناقضًا بين حرية التعبير والامتثال للضغوط السياسية والدولية. فبينما يؤكد التزامه بالشفافية، اتخذ قرارات أثارت جدلاً حول مدى حيادية منصة "إكس" في تغطية الصراع الفلسطيني الإسرائيلي. سلوكيات الذكاء الاصطناعي تُظهر هذه الحادثة مدى هشاشة سلوك النماذج اللغوية الكبيرة، وأنها قد تتأثر بشدة حتى بأبسط التغييرات في التوجيهات. ورغم أنها تُظهر سلوكًا قريبًا من التفاعل البشري، فإنها في النهاية ليست إلا أدوات تتبع التعليمات التي تُبرمج بها، من دون إدراك أو فهم حقيقي لما تقول. أثبتت أمثلة أخرى من نماذج مشابهة مثل Claude من شركة Anthropic أن تغييرات بسيطة في أوزان المفاهيم يمكن أن تؤدي إلى سلوكيات غريبة، مثل إعلان النموذج أنه يجسّد جسر البوابة الذهبية حرفيًا. وهو ما يدل على أن النماذج اللغوية لا تمتلك وعيًا ذاتيًا، بل تحاكي اللغة البشرية بناءً على الأنماط. يعكس هذا الحادث أهمية اليقظة في التعامل مع الذكاء الاصطناعي، وضرورة وجود رقابة تقنية صارمة على ما يُغذّى به من تعليمات، لأنه قادر على تضخيم أفكار معينة أو نشرها على نطاق واسع بمجرد تغيير بسيط في التعليمات الأولية.


عرب هاردوير
٢٣-٠٤-٢٠٢٥
- عرب هاردوير
FramePack.. تطبيق لتوليد الصور بالذكاء الاصطناعي بطريقة أسهل
توليد الصور ومقاطع الفيديو بالذكاء الاصطناعي يتطلب موارد كبرى مثل كروت رسومي قوية بحجم ذاكرة يبدأ من 12GB، لكن الاعتماد على كارت رسومي بحجم ذاكرة أقل من ذلك مثل 8GB أو 6GB يُعد أمرُا صعبًا، لكن هذا سيتغير مع تطبيق FramePack. تطبيق FramePack أسهل مما نتوقع يستطيع تطبيق FramePack توليد الصور ومقاطع الفيديو باستخدام سياق زمني محدد لمعالجة أكثر كفاءة، مما يتيح للمستخدمين إنشاء مقاطع فيديو أطول وبجودة أعلى. إذ يمكن لنموذج يضم 13 مليار معلمة، باستخدام تطبيق FramePack، إنشاء مقطع مدته 60 ثانية بالاعتماد على كارت رسومي يأتي بذاكرة حجمها 6GB فقط. التقنية المستخدمة مع هذا التطبيق كانت من ابتكار vmin Zhang الذي كشف عنها في منصة GitHub، بالتعاون مع مانيش أغراوالا من جامعة ستانفورد. هدف هذه التقنية توليد الصور والفيديو بالذكاء الاصطناعي، المختلف مع هذه التقنية الجديدة أنها تستطيع توليد الصور باستخدام حجم منخفض من الذاكرة الخاصة بالكروت الرسومية. يُعد تطبيق FramePack عبارة عن بنية شبكة عصبية تستخدم تقنيات تحسين متعددة المراحل لتمكين توليد الفيديو بالذكاء الاصطناعي. تتطلب نماذج الفيديو القياسية مجموعة كبيرة من ذاكرة VRAM الخاصة بالكارت، إذ يُعد حجم 12GB هو الحجم الموصى به. بالطبع، يمكنك استخدام ذاكرة بحجم أقل، لكن ذلك يأتي على حساب توليد مقاطع بمدة أقصر وجودة أقل وأوقات معالجة أطول. بالإضافة إلى تقنيات التخفيف من تدهور جودة الصورة كلما كانت مدة المقطع أطول، يمتاز تطبيق FramePack بتوليد فيديو أطول دون حصول تأثير الكبير على الدقة. ويتطلب تطبيق FramePack كارت رسومي من سلسلة RTX 30 أو 40 أو 50 مع دعم FP16 و BF16. اللافت أن التطبيق لم يشير إلى دعم كروت AMD أو Intel، لكنه يدعم نظام Linux أيضًا بجانب نظام ويندوز. يمكن القول أن معظم كروت NVIDIA RTX تفي أو تتجاوز معيار التطبيق الذي يتطلب ذاكرة بحجم لا يقل عن 6GB. هل تريد الحصول على أفضل النتائج؟ يمكن للكارت الرسومي RTX 4090 إنتاج ما يصل إلى 0.6 إطار في الثانية باستخدام تقنية TeaCache. بدلاً من الاعتماد على خدمات الطرف الثالث المكلفة، يمهد تطبيق FramePack الطريق لجعل توليد الفيديو بالذكاء الاصطناعي أكثر سهولة للمستهلك العادي. يمكنك تجربة هذا التطبيق من إن كنت تمتلك كارت رسومي يحتوي على ذاكرة بحجم لا يقل عن 6GB.


البيان
٢٥-٠٢-٢٠٢٥
- البيان
غوغل تعلن عن مساعد برمجي مجاني بالذكاء الاصطناعي بقدرات هائلة
أعلنت شركة غوغل عن إطلاق Gemini Code Assist للأفراد، وهو مساعد برمجي مجاني بالذكاء الاصطناعي يوفر إكمال تعليمات برمجية متطورًا وإصلاح الأخطاء تلقائيًا داخل بيئات التطوير الشائعة مثل VS Code وJetBrains. وبمعدل 180 ألف عملية إكمال كود شهريًا – أي 90 ضعف ما يقدمه GitHub Copilot المجاني – تقدم غوغل للمطورين أداة قوية لمساعدتهم في البرمجة. كما أن الأداة تدعم 240 طلب دردشة يوميًا، مما يجعلها واحدة من أكثر الأدوات من حيث الاستخدام المجاني. بهذه الخطوة، تسعى غوغل إلى منافسة مايكروسوفت وGitHub في سوق أدوات المطورين، مع توفير خيارات قوية ومجانية يمكن أن تدفع المستخدمين لاحقًا نحو النسخ المدفوعة للشركات. وبحسب موقع "تك كرانش" يتيح Code Assist for Individuals للمطورين استخدام نافذة دردشة للتحدث بلغة طبيعية مع نموذج الذكاء الاصطناعي من Google الذي يمكنه الوصول إلى قاعدة التعليمات البرمجية الخاصة بهم وتحريرها. تمامًا مثل أداة Copilot الشهيرة على GitHub ، يمكن لـ Gemini Code Assist for Individuals إصلاح الأخطاء أو إكمال أقسام التعليمات البرمجية أو شرح أجزاء من قاعدة التعليمات البرمجية التي لا معنى لها. ويستخدم مساعد الترميز AI من Google نسخة من نموذج Gemini 2.0 AI الخاص بالشركة والذي تم ضبطه بدقة لتطبيقات الترميز. من الجدير بالذكر أن خدمة Code Assist for Individuals تقدم 180 ألف عملية إكمال كود شهريًا، وهو ما يزيد 90 مرة عن الحد الأقصى للاستخدام في خطة GitHub Copilot المجانية (2000 عملية إكمال كود شهريًا). كما تأتي خدمة Code Assist for Individuals مع 240 طلب دردشة يوميًا، وهو ما يقرب من 5 أضعاف عدد الطلبات التي تقدمها خطة GitHub Copilot المجانية. ويحتوي النموذج الذي يدعم Code Assist for Individuals على نافذة سياقية تحتوي على 128000 رمز، وهو ما تقول Google إنه أكبر بأربع مرات مما تقدمه المنافسة. وهذا يعني أن النموذج يمكنه استيعاب المزيد من التعليمات البرمجية في موجه واحد، مما يسمح له بالاستدلال على قواعد التعليمات البرمجية الأكثر تعقيدًا. يمكن للمطورين التسجيل للحصول على المعاينة العامة المجانية لبرنامج Gemini Code Assist للأفراد بدءًا من اليوم الثلاثاء.