
نموذج «الذكاء الاصطناعي Gemma 3» من جوجل
نموذج الذكاء الاصطناعي 3 Gemma من Google يمثل قفزة كبيرة في نماذج الذكاء الاصطناعي المتاحة. تم إطلاقه في 12 مارس 2025، وهو مبني على نجاح سلسلة 2 Gemma، التي تجاوزت 100 مليون تحميل في عامها الأول. يأتي 3 Gemma بقدرات محسّنة في المعالجات متعددة الأنماط، ونافذة سياقية موسعة، ودعم واسع للغات متعددة. والأهم من ذلك، أنه مصمم للعمل على وحدة معالجة رسومات (GPU) أو وحدة معالجة توترية (TPU) واحدة دون التضحية بالأداء.
يرث 3 Gemma تقنياته الأساسية من نموذج 2.0 Gemini الرائد من Google، مما يمنحه قدرات قوية في الرياضيات، والاستدلال، والبرمجة، والدردشة. كما يدعم أكثر من 140 لغة مباشرة، مما يجعله نموذجاً عالمياً بحق.
* أهمية 3 Gemma:1- نافذة سياقية موسعة: يعد حجم النافذة السياقية أحد أبرز ميزات 3 Gemma، حيث تدعم النماذج الأكبر (4B و12B و27B) حتى 128,000 رمز، بينما يوفر نموذج 1B نافذة سياقية بحجم 32,000 رمز.* أهمية هذه السعة الكبيرة:
- تحليل الوثائق المطوّلة: يتيح للباحثين وعلماء البيانات إدخال نصوص أو قواعد برمجية كبيرة إلى النموذج، مما يسهل تلخيصها، وتحليلها، وطرح الأسئلة حولها في تمريرة واحدة.- تعزيز التفكير المعقّد: يمكن لـ 3 Gemma التعامل مع كميات أكبر من المعلومات دفعة واحدة، مما يساعده على الحفاظ على السياق في المدخلات الطويلة، وبالتالي توليد استجابات أكثر تماسكًا للأسئلة متعددة الخطوات.- دعم تدفقات العمل الإبداعية: يمكن للكتّاب والمبدعين التعامل مع نصوص وقصص طويلة دون الحاجة إلى تقسيمها إلى أجزاء أصغر. لكن الأداء المثالي عادةً يكون ضمن نطاق 32K رمز، رغم أن الحد الأقصى 128K يوفر مرونة كبيرة.
2- القدرات متعددة الأنماط: كانت نماذج Gemma السابقة تركز على النصوص فقط، أما الآن، فتأتي إصدارات 4B و12B و27B بقدرات فهم وتحليل الصور، مما يتيح: تحسين الإجابة على الأسئلة البصرية.يمكن للمستخدمين طرح أسئلة نصية حول صورة مرفوعة، مثل:
– «كم عدد السيارات في هذه الصورة؟».– «ماذا يقول النص على الملصق؟».تحليل الصور وإنشاء التسميات التوضيحية.يمكن لـ 3 Gemma التعرف على الكائنات، ووصف المشاهد، وحتى قراءة النصوص داخل الصور مع تفاوت دقة OCR.
3- دعم واسع للغات متعددة: يتميز 3 Gemma بتوسّع كبير في دعمه اللغوي:
- أكثر من 140 لغة: يشمل تغطية واسعة للغات الآسيوية، والأوروبية، والشرق أوسطية، وغيرها.- تحسينات في التشفير اللغوي: يعتمد على المُرمِّز SentencePiece المستوحى من 2.0 Gemini، والذي يضم 262,000 إدخال، مما يحسن معالجة اللغات الصينية واليابانية والكورية بشكل خاص.
* التحديات والاعتبارات:
- الهلوسة في الذكاء الاصطناعي: قد ينتج عن 3 Gemma إجابات غير دقيقة أو غير منطقية أحياناً، لذا من الضروري التحقق من صحة المخرجات عند استخدامها في المهام الحساسة.- التحيز والعدالة: مثل أي نموذج مفتوح يتم تدريبه على بيانات ضخمة، قد يعكس 3 Gemma بعض التحيزات الاجتماعية أو الثقافية. لذلك، من المهم مراقبة هذه المشكلات وتصحيحها، خاصة في التطبيقات الموجهة للمستخدمين.- المهام المعقدة (البرمجة والرياضيات): تشير التجارب المبكرة إلى أن 3 Gemma قد يواجه صعوبة في المهام البرمجية المتقدمة أو المسائل الرياضية المعقدة. لذا، يفضل اختباره جيداً قبل الاعتماد عليه في أتمتة هذه العمليات.- الأداء مع السياقات الكبيرة: رغم أن 128K رمز تعد ميزة قوية، إلا أن الأداء قد يتدهور عند الاقتراب من هذا الحد. لذا، من الأفضل التخطيط لاستخدام أكثر واقعية في نطاق 32 K رمز.- التحديثات المستمرة: يتطور مجال الذكاء الاصطناعي بسرعة كبيرة. للحصول على أحدث المعلومات الدقيقة، يوصى باستخدام تقنيات التحديث المستند إلى الاسترجاع أو التدريب المستمر عند الحاجة.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


البلاد البحرينية
منذ 2 أيام
- البلاد البحرينية
قوقل تطلق Mariner: وكيل ذكي يتولى تصفح الويب بدلاً منك
كشفت شركة قوقل الأمريكية النقاب عن مشروعها التجريبي الطموح Project Mariner، والذي يعتبر نقلة نوعية في عالم التفاعل مع الإنترنت. شركة قوقل تكشف عن مشروع Mariner: الوكيل الذكي الذي يتصفح الإنترنت بدلاً من المستخدم وبحسب ما ذكرته تقارير تقنية، فإن هذا الوكيل الذكي المدعوم بأحدث تقنيات الذكاء الاصطناعي، يعد بتغيير جذري في طريقة استخدام المستخدمين للإنترنت، حيث يمكنه تصفح المواقع الإلكترونية وتنفيذ المهام المختلفة نيابة عن المستخدم بكفاءة واستقلالية تامة. وتكمن الفكرة الأساسية وراء Project Mariner في تمكين المستخدمين من إنجاز مهام متعددة ومعقدة عبر الإنترنت، دون الحاجة إلى التدخل المباشر، أو زيارة المواقع الإلكترونية بأنفسهم. وأوضحت التقارير أنه يمكن للوكيل الذكي القيام بمهام متنوعة، مثل شراء التذاكر للفعاليات أو الرحلات، أو التسوق عبر الإنترنت واتخاذ قرارات الشراء، أو حتى البحث عن المعلومات وتجميعها من مصادر متعددة. وتخطط قوقل لدمج مشروع Mariner قريباً ضمن وضع الذكاء الاصطناعي، في تجربة البحث الجديدة والمحدثة التي تطورها الشركة، وذلك كجزء من مرحلة تجريبية أولية تهدف إلى اختبار التكامل والأداء قبل الإطلاق الرسمي الواسع. ولفتت التقارير إلى أن ما يجعل هذا المشروع مثيراً أيضاً للاهتمام، هو خطط قوقل لدمج قدرات Mariner المتطورة في واجهات برمجة التطبيقات الخاصة بمنصتي Gemini وVertex. وهذا التطوير سيفتح المجال أمام المطورين والشركات، لبناء تطبيقات ذكية ومبتكرة تستفيد من قدرات هذا الوكيل الذكي في أعمالهم ومشاريعهم التقنية. كما أكدت الشركة أنها تعمل حالياً على تطوير شراكات استراتيجية مع عدد من المنصات والمواقع الإلكترونية الشهيرة والمؤثرة، بهدف ضمان عمل Mariner عبر هذه المنصات بسلاسة وكفاءة عالية، مما يوسع من نطاق الخدمات والمهام التي يمكن للوكيل الذكي تنفيذها نيابة عن المستخدمين. وأشارت التقارير إلى أن قوقل تتبنى نهجاً تجارياً متدرجاً لإطلاق مشروع Mariner، حيث أعلنت أن المشروع سيكون متاحاً حصرياً لمشتركي باقة AI Ultra الجديدة والمتميزة، والتي تبلغ تكلفتها الشهرية 250 دولاراً أمريكياً. وفي البداية، ستقتصر الخدمة على المستخدمين داخل الولايات المتحدة الأمريكية، لكن الشركة تعد بتوسيع نطاق الخدمة تدريجياً لتشمل المزيد من البلدان حول العالم في المستقبل القريب. تم نشر هذا المقال على موقع


البلاد البحرينية
منذ 2 أيام
- البلاد البحرينية
Veo 3 من قوقل: طفرة في توليد الفيديو بالذكاء الاصطناعي
كشفت شركة قوقل الأمريكية مؤخراً عن الجيل الثالث من نموذج الذكاء الاصطناعي Veo، الذي يتميز بقدرات فائقة في توليد مقاطع الفيديو. الجيل الثالث من نموذج قوقل Veo: أبرز المزايا والابتكارات في إنتاج الفيديو وبحسب ما ذكرته تقارير تقنية، فإن نموذج Veo 3 من قوقل يعد قفزة نوعية في مجال توليد الفيديو بالذكاء الاصطناعي، حيث يتميز بمجموعة من المزايا الرئيسية التي تجعله مختلفاً عن سابقيه، ويمنحه تفوقاً على منافسيه. وتتضمن هذه المزايا: توليد صوت متكامل مع الفيديو: يمكن لـ Veo 3 إنشاء مقاطع فيديو تحتوي على صوت متزامن، بما يشمل المؤثرات الصوتية، الضوضاء الخلفية، وحتى الحوار بين الشخصيات، مما يضفي واقعية أكبر على المحتوى، ويقلل الحاجة إلى تحرير الصوت بشكل منفصل. جودة بصرية عالية: النموذج الجديد يقدم مقاطع فيديو بجودة عالية جداً، مع قدرة على توليد مقاطع طويلة نسبياً مقارنة بمعظم أدوات الذكاء الاصطناعي، مع تحسينات واضحة في التفاصيل البصرية، مثل الأقمشة والمياه وحركة الحيوانات. دقة الفهم والتعامل مع التعليمات: إن Veo 3 قادر على فهم التعليمات النصية الطويلة والمعقدة، وترجمتها إلى مشاهد متسلسلة ومتماسكة، مع الالتزام بتسلسل الأحداث والعلاقات بين الشخصيات والعناصر في المشهد. تحريك الشفاه: النموذج الجديد يدعم ميزة تحريك الشفاه بدقة، بحيث تبدو الشخصيات وكأنها تتحدث فعلياً، مما يعزز انطباع الواقعية في مشاهد الحوار. تحكم متقدم في الكاميرا والمشاهد: يوفر Veo 3 أدوات تحكم متطورة في زوايا الكاميرا، الحركة، والإضاءة، مع إمكانية إزالة أو تعديل عناصر المشهد حسب الحاجة، ما يمنح المستخدمين مرونة إبداعية كبيرة. إدارة الأصول والمشاهد: باستخدام هذا النموذج، يمكن للمستخدمين تنظيم وإعادة استخدام الشخصيات، الدعائم، والتعليمات، عبر عدة مشاهد، مع ضمان استمرارية الحركة والاتساق بين المشاهد. وضع العلامات المائية: إن جميع مقاطع الفيديو الناتجة عن Veo 3 تحمل علامة مائية غير مرئية، لتحديد هويتها كمنتجات ذكاء اصطناعي، مما يعزز الشفافية، ويحد من انتشار المحتوى المضلل. تكامل مع أدوات قوقل الأخرى: يتكامل Veo 3 مع منصة Flow الجديدة لتحرير الفيديو، وكذلك مع تطبيق Gemini، مما يسهل عملية الإنتاج والتحرير للمستخدمين من مختلف المستويات. وأضافت التقارير أن هذه المزايا تجعل Veo 3 أداة قوية لكل من المبتدئين والمحترفين في صناعة المحتوى، وتفتح آفاقاً جديدة في مجال السرد البصري والسينمائي باستخدام الذكاء الاصطناعي. تم نشر هذا المقال على موقع


البلاد البحرينية
منذ 2 أيام
- البلاد البحرينية
متصفح قوقل كروم أصبح أكثر ذكاء مع Gemini
أعلنت شركة قوقل الأمريكية مؤخراً عن خطوة هامة، والتي تمثل في إدماج مساعدها Gemini، المدعوم بالذكاء الاصطناعي، مباشرة داخل متصفح كروم. قوقل تدمج Gemini في كروم: ثورة في تصفح الويب بالذكاء الاصطناعي وبحسب ما ذكرته تقارير تقنية، فإن هذه الخطوة تمثل نقلة نوعية في تجربة التصفح، حيث تهدف قوقل إلى تقديم معلومات مبسطة وتفاعلية بشكل مباشر، مما يعزز من كفاءة وفاعلية استخدام الويب. وأشارت قوقل إلى أن كروم لم يعد مجرد بوابة للمعلومات، بل أصبح رفيقًا ذكياً يساعد المستخدم على فهم العالم الرقمي. وأوضحت أن Gemini سيقدم في مراحله الأولية قدرة فريدة على تبسيط المعلومات المعقدة في أي صفحة ويب يزورها المستخدم. فبدلاً من قضاء وقت طويل في قراءة مقالات مطولة أو مستندات تقنية، سيتمكن Gemini من تلخيص المحتوى بفعالية، وتقديم النقاط الأساسية بشكل واضح وموجز. وهذه الميزة ستكون مفيدة بشكل خاص للطلاب، الباحثين، أو أي شخص يحتاج إلى استيعاب كميات كبيرة من المعلومات بسرعة. وتطمح قوقل إلى تطوير Gemini ليصبح أكثر تكاملاً وقوة، حيث تشمل الخطط المستقبلية تطوير قدرته على العمل عبر عدة تبويبات في وقت واحد، مما يعني أنه سيتمكن من مساعدتك في مهام تتطلب التنقل بين صفحات متعددة. أما الميزة الأكثر إثارة للاهتمام هي جعل Gemini يتصفح المواقع بدلاً من المستخدم، وهي ميزة واعدة تفتح آفاقاً جديدة للأتمتة والراحة في التصفح. ولفتت التقارير إلى أن قدرات Gemini ستبدأ بالعمل عبر تبويبين فقط في البداية، لافتة إلى أن قوقل تخطط لتوسيع هذه القدرات خلال هذا العام ليعمل عبر عدة تبويبات بشكل متزامن، مما سيعزز من قدرته على المساعدة في المهام المعقدة. ومن المقرر أن تبدأ قوقل طرح Gemini في كروم بداية من الأسبوع الجاري، كنسخة تجريبية على نظامي ويندوز وماك. وستكون هذه النسخة متاحة للمستخدمين الذين تجاوزت أعمارهم 18 عاماً، ويستخدمون اللغة الإنجليزية، وذلك من خلال القنوات التجريبية لكروم: Chrome Beta وCanary و Dev. كما أنه سيكون متاحاً للمشتركين في باقتي Google AI Pro و AI Ultra. وفيما يتعلق بنسخة الهاتف المحمول، أوضحت قوقل أن الأمر ما زال قيد الدراسة، حيث تركز الشركة حالياً على تحسين تجربة Gemini في الحواسب، ولكن من المرجح أن نرى هذه الميزات تصل إلى الأجهزة المحمولة في المستقبل القريب. تم نشر هذا المقال على موقع