أحدث الأخبار مع #SoundStream


الشرق السعودية
١٧-٠٤-٢٠٢٥
- علوم
- الشرق السعودية
جوجل تكشف عن نموذج ذكي يمهد للتواصل مع الدلافين
أعلنت شركة "جوجل" عن تطوير نموذج ذكاء اصطناعي جديد يُعرف باسم DolphinGemma، بالتعاون مع باحثين في معهد جورجيا للتكنولوجيا، ومشروع Wild Dolphin Project، يهدف إلى تحليل وفهم نمط تواصل الدلافين، ومحاولة الرد على أصواتها بتسلسلات صوتية تحاكي لغتها. ويضع هذا الابتكار حجر الأساس لتواصل محتمل بين البشر وهذه الكائنات البحرية الذكية عبر دمج تكنولوجيا الذكاء الاصطناعي المتقدمة مع عقود من البحث الميداني. وذكرت الشركة في بيان أن نموذج DolphinGemma يعتمد على قاعدة بيانات ضخمة جرى تجميعها على مدار نحو 4 عقود من خلال مشروع WDP، والذي يُعد أطول برنامج بحثي تحت الماء مخصص لدراسة مجتمع من دلافين "أطلسية مرقطة" تعيش في جزر الباهاما. ووثَّق الباحثون آلاف الساعات من الفيديوهات والأصوات، ربطوا خلالها الأصوات المنبعثة من كل دولفين بسلوكياته المحددة وهويته الفردية، ما أسهم في تشكيل قاعدة بيانات نادرة ومفصلة. ومن بين هذه الأنماط الصوتية، سجل الباحثون الصافرات المميزة التي تُمثّل "أسماء فردية" وتُستخدم بين الأمهات وصغارهن، ونبضات انفجارية تصدر أثناء النزاعات، وأصوات النقر السريعة المرتبطة بسلوكيات المغازلة، أو مطاردة أسماك القرش. يُعد DolphinGemma نموذجاً صوتياً متطوراً قائماً على معمارية تستخدم تقنيات جوجل الصوتية مثل SoundStream، ويحتوي على نحو 400 مليون متغير، ما يجعله خفيفاً ويمكن تشغيله مباشرة على هواتف "بيكسل" (Pixel) الذكية المستخدمة ميدانياً من قِبَل الباحثين. ويعمل النموذج بنفس مبدأ نماذج اللغة الكبيرة المستخدمة في معالجة اللغة البشرية، إذ يتعلم أنماط تسلسل الأصوات لتوقُّع الصوت التالي، وهذا النهج يتيح للباحثين رصْد تكرارات صوتية ربما تشير إلى قواعد لغة الدلافين. التواصل التفاعلي بالتوازي مع تحليل الأصوات الطبيعية، يعمل فريق WDP على مسار آخر يعتمد على بناء تفاعل مباشر بين الإنسان والدلافين باستخدام منظومة تُعرف باسم CHAT، وهي جهاز حاسوب تحت الماء طورته جامعة جورجيا بهدف وضع قاموس مشترك قائم على صافرات اصطناعية. ويعتمد النظام على ربط صافرات مصطنعة بأشياء مادية تحبها الدلافين، مثل الأعشاب البحرية، أو قطع قماش ملونة. ويتم تدريب الدلافين على تقليد الصافرات للإشارة إلى رغبتها في هذه الأشياء، وتعزز هذه الاستجابة من خلال تزويد الباحث بإشارة صوتية فورية توضح له طلب الدولفين عبر سماعات توصيل عظمي. واستخدم الباحثون هاتف "بيكسل 6" لتحليل الأصوات بدقة عالية في الزمن الحقيقي، فيما من المقرر أن يشهد صيف 2025 إطلاق نسخة محدثة تعتمد على "بيكسل 9"، مدعومة بوظائف إضافية مثل الميكروفون والسماعة وتحليل فوري مزدوج باستخدام الذكاء الاصطناعي. تقليص الفجوة بين الإنسان والدولفين ساهم استخدام هواتف Pixel في تقليل التكاليف والحجم، وخفَّض من الحاجة إلى أجهزة مخصصة باهظة الثمن، ما يمنح المشروع مرونة أكبر للعمل في بيئة المحيط المفتوحة. وفي خطوة لفتح آفاق التعاون العلمي، تعتزم جوجل نشر نموذج DolphinGemma مفتوح المصدر خلال صيف 2025، ليُتاح للعلماء والباحثين العاملين على أنواع أخرى من الدلافين مثل "الدولفين قاروري الأنف" و"الدولفين الدوار"، مع إمكانية تعديل النموذج ليتناسب مع اختلافات الأصوات.

بوابة ماسبيرو
١٧-٠٤-٢٠٢٥
- علوم
- بوابة ماسبيرو
جوجل تصمم نموذج لذكاء اصطناعي لمعرفة "لغة الدلافين"
قامت شركة جوجل بتصميم نموذج ذكاء اصطناعي لمساعدة العلماء في دراسة طريقة تواصل الدلافين مع بعضها البعض وفهم ما تقوله ، والذي اعتمد على نماذج الذكاء الاصطناعي المفتوحة المصدر "Gemma" من "جوجل" ويحمل النموذج اسم "DolphinGemma". وتتعاون شركة جوجل في هذا المشروع مع باحثين من معهد جورجيا للتكنولوجيا والمشروع الميداني المتخصص في دارسة الدلافين، بحسب ما كتبته الشركة على مدونتها أمس ، وتم تدريب النموذج على تعلُّم بنية الأصوات التي تصدرها الدلافين، والقدرة على توليد تسلسلات صوتية جديدة تشبه أصواتها الحقيقية. ويستخدم النموذج تقنية صوتية تسمى "SoundStream" لتشفير أصوات الدلافين، مما يسمح بتضمين الأصوات في النموذج أثناء تسجيلها ، ليساعد العلماء في استنباط أنماط مُعقدة تُتيح إنشاء مفردات مشتركة. وتزعم "جوجل" أن فحص البشر للبيانات بهذه الطريقة سيستغرق وقتًا طويلاً للغاية. ومن خلال تحديد الأنماط الصوتية المتكررة والتجمعات والتسلسلات الموثوقة، يمكن للنموذج مساعدة الباحثين على كشف المعاني المحتملة داخل تواصل الدلافين الطبيعي، وهي مهمة كانت تتطلب سابقا جهدا بشريا هائلا. وبمرور الوقت، قد تستخدم هذه الأنماط، إلى جانب أصوات تركيبة صناعية ينشئها الباحثون للإشارة إلى أشياء تحب الدلافين اللعب بها، لتطوير مفردات مشتركة تسمح بتواصل تفاعلي حقيقي بين البشر والدلافين.


رؤيا نيوز
١٦-٠٤-٢٠٢٥
- علوم
- رؤيا نيوز
'غوغل' تطور نموذج ذكاء اصطناعي للمساعدة في التواصل مع الدلافين
طورت شركة غوغل نموذج ذكاء اصطناعي لمساعدة العلماء في دراسة طريقة تواصل الدلافين مع بعضها البعض، وفهم ما تقوله. ويحمل النموذج اسم 'DolphinGemma'، وهو أحد النماذج اللغوية الكبيرة، ويعتمد على نماذج الذكاء الاصطناعي المفتوحة المصدر 'Gemma' من 'غوغل'، والتي بُنيت بدورها على الأسس نفسها لنماذج 'Gemini' التجارية للشركة. ولطالما كان مختلف الأصوات التي تصدرها الدلافينـ بما في ذلك النقرات والصفارات والنبضات، أحد التحديات أمام العلماء لعقود.وتتعاون 'غوغل' في هذا المشروع مع باحثين من معهد جورجيا للتكنولوجيا والمشروع الميداني 'Wild Dolphin Project' المتخصص في دارسة الدلافين، بحسب ما كتبته الشركة على مدونتها يوم الاثنين. وتم تدريب نموذج 'DolphinGemma' على تعلُّم بنية الأصوات التي تصدرها الدلافين، والقدرة على توليد تسلسلات صوتية جديدة تشبه أصواتها الحقيقية. ويستخدم النموذج تقنية صوتية من تطوير 'غوغل' تُسمى 'SoundStream' لتشفير أصوات الدلافين، مما يسمح بتضمين الأصوات في النموذج أثناء تسجيلها. ويأمل الفريق أن يُساعد 'DolphinGemma' في استنباط أنماط مُعقدة تُتيح إنشاء مفردات مشتركة. وتزعم 'غوغل' أن فحص البشر للبيانات بهذه الطريقة سيستغرق وقتًا طويلاً للغاية. وبدأ مشروع 'Wild Dolphin Project' بالفعل في استخدام نموذج 'DolphinGemma ' خلال موسم العمل الميداني الحالي، مع وعود بفوائد فورية. ومن خلال تحديد الأنماط الصوتية المتكررة والتجمعات والتسلسلات الموثوقة، يمكن للنموذج مساعدة الباحثين على كشف البُنى الخفية والمعاني المحتملة داخل تواصل الدلافين الطبيعي، وهي مهمة كانت تتطلب سابقًا جهدًا بشريًا هائلًا. وبمرور الوقت، قد تُستخدم هذه الأنماط، إلى جانب أصوات تركيبية صناعية يُنشئها الباحثون للإشارة إلى أشياء تحب الدلافين اللعب بها، لتطوير مفردات مشتركة تسمح بتواصل تفاعلي حقيقي بين البشر والدلافين. ويستخدم الفريق هواتف بيكسل من 'غوغل' ميدانيًا، لذا كان من الضروري أن يكون النموذج فعالًا. وغالبًا ما يُمثل تشغيل نماذج الذكاء الاصطناعي على الهواتف الذكية تحديًا نظرًا لمحدودية الموارد. وكلما كان النموذج أكبر وأكثر كفاءة، زادت ذاكرة الوصول العشوائي ومعدل المعالجة اللازم لتشغيله. لكن نموذج 'DolphinGemma' عالج هذه المشكلة، إذ يتكون من حوالي 400 مليون معلمة فقط، وهو ما يُعتبر صغيرًا بالنسبة للنماذج اللغوية الكبيرة. وتخطط 'غوغل' لإصدار 'DolphinGemma' كنموذج مفتوح المصدر هذا الصيف، لتوفير أدوات للباحثين في أنحاء العالم لتحليل بيانات الصوت خاصتهم وتسريع أبحاثهم عن الأنماط.


النهار
١٦-٠٤-٢٠٢٥
- علوم
- النهار
غوغل" تطور نموذج ذكاء اصطناعي لفكّ شفرة تواصل الدلافين"
أعلنت شركة "غوغل" تطويرها نموذج ذكاء اصطناعي جديداً، أطلقت عليه اسم "DolphinGemma"، ويهدف إلى دعم جهود العلماء في دراسة لغة التواصل بين الدلافين وفهم أصواتها المتنوعة. ويُعدّ هذا النموذج جزءاً من عائلة النماذج اللغوية الكبيرة المبنية على تقنيات "Gemma" مفتوحة المصدر من "غوغل"، والتي تستند بدورها إلى الأسس التقنية ذاتها المستخدمة في نماذج "Gemini" التجارية للشركة. لطالما شكّل التنوع الكبير في أصوات الدلافين، كالنقرات والصفرات والنبضات، تحدّياً معقداً أمام الباحثين لفك رموز تواصل هذه الكائنات البحرية على مدار عقود. ويتعاون فريق "غوغل" في تطوير هذا المشروع مع معهد جورجيا للتكنولوجيا، بالإضافة إلى مشروع "Wild Dolphin Project" المتخصص في مراقبة ودراسة سلوك الدلافين في بيئاتها الطبيعية، وفق ما أوضحته الشركة في منشور عبر مدونتها الرسمية. وتمّ تدريب نموذج "DolphinGemma" على التعرف على الأنماط الصوتية التي تصدرها الدلافين، مع قدرته على إنتاج تسلسلات صوتية جديدة تحاكي أصواتها الطبيعية، ويستعين النموذج بتقنية صوتية متقدّمة، طوّرتها غوغل، تحمل اسم "SoundStream"، وتتيح ترميز الأصوات وإدخالها مباشرة في النظام أثناء عملية التسجيل. ويأمل الباحثون في أن يسهم هذا النموذج في اكتشاف أنماط صوتية معقّدة قد تساعد على بناء قاموس أو مفردات مشتركة بين البشر والدلافين، وهي مهمّة شاقة، كان تحليلها يدوياً يتطلّب وقتاً طويلاً وجهداً هائلاً من العلماء. وقد بدأ مشروع "Wild Dolphin Project" فعلياً باستخدام نموذج "DolphinGemma" خلال موسم العمل الميداني الحالي، مع توقعات بتحقيق فوائد ملموسة وسريعة. ومن خلال تحليل التكرارات الصوتية والتسلسلات المنتظمة التي يرصدها النموذج، يمكن للعلماء تتبع البُنى الصوتية الخفية داخل تواصل الدلافين، مما قد يمهّد مستقبلاً لتطوير وسائل تواصل تفاعلية تعتمد على أصوات صناعية تحاكي لغة الدلافين. واستعداداً للاستخدام الميدانيّ، تمّ تصميم "DolphinGemma" ليكون مناسباً للعمل على الهواتف الذكية، وتحديداً أجهزة "بيكسل" من "غوغل"، إذ تمّ تقليل حجمه ليصل إلى نحو 400 مليون معلّمة فقط، وهو رقم صغير نسبياً مقارنة بحجم النماذج اللغوية الكبيرة، مما يجعله أكثر كفاءة في استهلاك الموارد، وسهل التشغيل على الأجهزة ذات الإمكانيات المحدودة. وتعتزم "غوغل" إصدار "DolphinGemma" كنموذج مفتوح المصدر خلال صيف هذا العام، بهدف إتاحة أدوات متقدّمة للباحثين حول العالم لتحليل بياناتهم الصوتية الخاصة، وتسريع أبحاثهم المتعلقة بفهم طرق تواصل الحيوانات البحرية.