
تقنيات إنتاج الألحان الموسيقية من مدخلات بيانات مختلفة
طور علماء الكمبيوتر، خلال الآونة الأخيرة، العديد من أدوات التعلم الآلي عالية الأداء لإنتاج النصوص والصور ومقاطع الفيديو والأغاني. حيث صممت معظم هذه النماذج التقنية لإنشاء محتوى بناءً على مدخلات البيانات يقدمها المستخدمون.
وأجرى باحثون في جامعة هونغ كونغ للعلوم والتكنولوجيا مؤخرًا نموذج AudioX. وهو نموذج يمكنه توليد مسارات صوتية وموسيقية عالية الجودة باستخدام النصوص ولقطات الفيديو والصور والموسيقى والتسجيلات الصوتية كمدخلات.
كما يعتمد نموذجهم، الذي تم تقديمه في ورقة بحثية منشورة على خادم ما قبل الطباعة arXiv، على محول الانتشار. وهي خوارزمية متقدمة للتعلم الآلي. والتي تتبنى آلية المحول لتوليد المحتوى عن طريق إزالة الضوضاء تدريجيًا من البيانات المدخلة التي تتلقاها.
دراسات بحثية حول تحويل البيانات إلى موسيقى
قال وي شويه؛ المؤلف المقابل للورقة البحثية، لـ موقع Tech Xplore'ينبع بحثنا من سؤال أساسي في الذكاء الاصطناعي: كيف يمكن للأنظمة الذكية تحقيق فهم وتوليد موحد عبر الوسائط؟ 'إن الإبداع البشري هو عملية متكاملة بسلاسة. حيث يتم دمج البيانات من القنوات الحسية المختلفة بشكل طبيعي بواسطة الدماغ. وقد اعتمدت الأنظمة التقليدية في كثير من الأحيان على نماذج متخصصة. وفشلت في التقاط ودمج هذه الروابط الجوهرية بين الطرائق'.
بينما استهدفت الدراسة الأخيرة التي قادها 'وي شوي' و'يكي قوه' وزملاؤهما تطوير إطار عمل موحد لتعلم التمثيل. حيث سيسمح هذا الإطار لنموذج فردي بمعالجة المعلومات عبر مسارات متنوعة (أي النصوص والصور ومقاطع الفيديو والمسارات الصوتية). ذلك بدلًا من الجمع بين نماذج متميزة يمكنها فقط معالجة نوع معين من البيانات.
قال 'شوي': 'نحن نهدف إلى تمكين أنظمة الذكاء الاصطناعي من تكوين شبكات مفاهيمية متعددة الوسائط مشابهة للدماغ البشري'.
Audio X.. نموذج تحويل البيانات إلى موسيقى
وأضاف 'يمثل نموذج AudioX الذي ابتكرناه نقلة نوعية تهدف إلى معالجة التحدي المزدوج المتمثل في المواءمة المفاهيمية والزمنية. وبعبارة أخرى. فهو مصمم لمعالجة مسألتي 'ماذا' (المواءمة المفاهيمية) و'متى' (المواءمة الزمنية) في آن واحد. ويتمثل هدفنا النهائي في بناء نماذج عالمية قادرة على التنبؤ، وتوليد تسلسلات متعددة الوسائط تظل متسقة مع الواقع'.
يمكن للنموذج الجديد القائم على محول الانتشار الجديد الذي طوره الباحثون توليد مقطوعات صوتية أو ألحان موسيقية عالية الجودة باستخدام أي بيانات. تفتح هذه القدرة على تحويل 'أي شيء' إلى صوت إمكانيات جديدة لصناعة الترفيه والمهن الإبداعية.
فعلى سبيل المثال، السماح للمستخدمين بإنشاء موسيقى تناسب مشهدًا مرئيًا معينًا أو استخدام مجموعة من المدخلات (مثل النصوص ومقاطع الفيديو) لتوجيه توليد المقطوعات المرغوبة.
وأوضح 'شوي' قائلًا: 'إن AudioX مبني على أساس محول الانتشار. ولكن ما يميزه عن غيره هو إستراتيجية الإخفاء متعدد الوسائط'. 'تعيد هذه الإستراتيجية بشكل أساسي تصور كيفية تعلم الآلات لفهم العلاقات بين أنواع مختلفة من المعلومات.
وأضاف 'من خلال إخفاء العناصر عبر طرائق الإدخال أثناء التدريب (أي إزالة انتقائية للبقع من إطارات الفيديو أو الرموز من النص أو المقاطع الصوتية من الصوت). وتدريب النموذج على استعادة المعلومات المفقودة من الطرائق الأخرى. فإننا نخلق مساحة تمثيل موحدة'.
وجدير بالذكر أن AudioX هو أحد النماذج الأولى التي جمعت بين الأوصاف اللغوية والمشاهد المرئية والأنماط الصوتية. حيث يلتقط المعنى الدلالي والبنية الإيقاعية لهذه البيانات متعددة الوسائط.
أهمية نماذج تحويل النصوص إلى موسيقى
كما يسمح تصميمه الفريد من نوعه بإنشاء ارتباطات بين أنواع مختلفة من البيانات. على غرار الطريقة التي يدمج بها الدماغ البشري المعلومات التي تلتقطها الحواس المختلفة.
يقول 'شوي' إن AudioX هو النموذج التأسيسي الأكثر شمولًا لتحويل البيانات إلى ألحان موسيقية. مع العديد من المزايا الرئيسية.
وهو يعد إطار عمل موحد يدعم المهام المتنوعة للغاية ضمن بنية نموذج واحد. كما أنه يتيح التكامل بين الأنماط من خلال إستراتيجية التدريب متعدد الأنماط المقنعة. ما يخلق مساحة تمثيل موحدة.
كما أنه يتمتع بقدرات توليد متعددة الاستخدامات. حيث يمكنه التعامل مع كل من الصوت العام والموسيقى بجودة عالية، ويتم تدريبه على مجموعات بيانات واسعة النطاق بما في ذلك مجموعاتنا المنسقة حديثًا.
في الاختبارات الأولية، تبين أن النموذج الجديد الذي ابتكره شيويه وزملاؤه ينتج مقطوعات صوتية وموسيقية عالية الجودة. حيث نجح في دمج النصوص ومقاطع الفيديو والصور والصوت.
ومن أبرز ما يميزه أنه لا يجمع بين نماذج مختلفة، بل يستخدم محول انتشار واحد لمعالجة ودمج أنواع مختلفة من بيانات.
قال 'شيوي': 'يدعم AudioX مهام متنوعة في بنية واحدة. ذلك بدءًا من تحويل النص/ الفيديو إلى صوت إلى رسم الصوت وإكمال الموسيقى. متقدمًا بذلك على الأنظمة التي تتفوق عادة في مهام محددة فقط'.
وأشار 'يمكن أن يكون لهذا النموذج تطبيقات محتملة متنوعة، تمتد عبر إنتاج الأفلام وإنشاء المحتوى والألعاب'.
فعلى سبيل المثال، صانع الأفلام لم يعد بحاجة إلى مؤثرات صوتية لكل مشهد'.
'يمكن لـ AudioX توليد خطوات أقدام على الثلج أو صرير الأبواب أو حفيف أوراق الشجر تلقائيًا استنادًا إلى اللقطات المرئية فقط. وبالمثل. كما يمكن استخدامه من قبل المؤثرين لإضافة الموسيقى الخلفية المثالية على الفور إلى مقاطع الفيديو الراقصة على TikTok أو من قبل مستخدمي YouTube لتعزيز مدونات الفيديو الخاصة بهم أثناء السفر مع مشاهد صوتية. ذلك بناء على البيانات المطلوبة.
وأخيرًا، يمكن أيضًا استخدام AudioX من قِبل مطوري ألعاب الفيديو لإنشاء ألعاب غامرة ومتكيفة. حيث تتكيف أصوات الخلفية دينامكيًا مع تصرفات اللاعبين.
فعلى سبيل المثال، عندما تتحرك الشخصية من أرضية خرسانية إلى العشب، يمكن أن يتغير صوت خطواتها. أو يمكن أن تصبح الموسيقى التصويرية للعبة أكثر توترًا تدريجيًا مع اقترابها من تهديد أو عدو.
المقال الأصلي: من هنـا

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


النشرة
منذ 31 دقائق
- النشرة
أكسيوس عن مسؤولين إسرائيليين: إسرائيل تستعد لضرب منشآت إيران النووية إذا انهارت المفاوضات بين واشنطن وطهران
اشار موقع أكسيوس الاميركي نقلا عن مسؤولين إسرائيليين، الى ان إسرائيل تستعد لضرب منشآت إيران النووية إذا انهارت المفاوضات النووية بين واشنطن وطهران. ولفت أكسيوس نقلا عن مسؤولين إسرائيليين، الى ان أي ضربة على إيران لن تكون واحدة بل ستكون حملة عسكرية تستمر أسبوعا على الأقل. وذكر "أكسيوس" بحسب مسؤول إسرائيلي، بان رئيس الوزراء الاسرائيلي بنيامين نتانياهو عقد اجتماعا حساسا مع وزراء ومسؤولي الأمن والاستخبارات بشأن المحادثات النووية.

مصرس
منذ 32 دقائق
- مصرس
محمد عبد الستار يكتب: بعد النجاح في الزراعة ثم الصناعة.. التكنولوجيا هدف «مستقبل مصر» القادم؟
في خطوة جديدة تُجسد الرؤية المصرية الطموحة للتنمية المستدامة، افتتح السيد الرئيس عبد الفتاح السيسي المرحلة الأولى من المنطقة الصناعية بجهاز مستقبل مصر للتنمية المستدامة، وذلك في قلب مشروع "مستقبل مصر" بالدلتا الجديدة، والذي يُعد أحد المشروعات القومية الرائدة في مجال الزراعة واستصلاح الأراضي. لطالما ارتبط اسم جهاز مستقبل مصر في أذهان الكثيرين بالمشروعات الزراعية الضخمة فقط، ولكن المشهد اليوم تغيّر كليًا. فمع افتتاح المدينة الصناعية الجديدة، بدأ الجهاز صفحة جديدة تؤكد تحوله إلى كيان متكامل يجمع بين الزراعة والصناعة من خلال إقامة مصانع كبرى تعتمد على الإنتاج الزراعي المحلي، ما يفتح آفاقًا واعدة لفرص التشغيل، وتعظيم القيمة المضافة للمنتج المصري، وتقليل الاعتماد على الاستيراد.توسع جغرافي وشمولي في المهام التنمويةلم تَعُد أنشطة جهاز مستقبل مصر مقتصرة على نطاق "الدلتا الجديدة" فقط، بل امتدت لتشمل مناطق متعددة مثل الفيوم، والمنيا، وأسوان، والواحات، ليصبح الجهاز شريكًا رئيسيًا في تحقيق الأمن الغذائي في مختلف أقاليم الجمهورية.كما أسس الجهاز منظومة متكاملة تشمل صوامع لتخزين الحبوب، وبدأ في تنفيذ مشروعات قومية جديدة في مجالات إدارة البحيرات، والتعدين، والتنمية العمرانية، كان آخرها المساهمة في إنشاء مدنذكية صديقة للبيئة. هذا بالإضافة إلى مشروعات النقل وتوزيع الكهرباء، والميكنة الزراعية، والطاقة الشمسية، ما يضع الجهاز في قلب منظومة التنمية المصرية الشاملة.التكنولوجيا... قاطرة المرحلة القادمةغير أن المفاجأة الحقيقية التي تمثل قاطرة التحول الاقتصادي خلال السنوات القادمة، هي دخول جهاز مستقبل مصر بقوة إلى مجال التحول الرقمي والخدمات التكنولوجية. فقد أصبح الجهاز أحد أبرز الفاعلين في تأسيس البنية التحتية الرقمية للقطاع الزراعي والخدمي في مصر.واستعدادًا لتلك المرحلة، أنشأ الجهاز شركة متخصصة في التحول الرقمي الزراعي تحت اسم Digital Smart Tree، تهدف إلى حصر وتصنيف الأراضي والمحاصيل الزراعية وربطها بمنصات التداول مثل البورصة الزراعية والسلعية، وهو ما يساهم في تنظيم السوق الزراعي وتحقيق شفافية أكبر في تسعير المنتجات.مصر... بوابة البيانات الدوليةومع امتلاك مصر ل17 كابل بحري دولي يمر عبر أراضيها، تحتل الدولة المرتبة الثانية عالميًا بعد الولايات المتحدة في عدد الكابلات البحرية، مما يُؤهلها لتكون مركزًا عالميًا لإنشاء مدن مخصصة لمراكز البيانات (Data Centers)، خاصة في ظل ما تمتلكه من موقع جغرافي استراتيجي وبنية تحتية تقنية متطورة.وتُعد هذه الخطوة تتويجًا لرؤية الدولة المصرية في أن تصبح محورًا إقليميًا لتكنولوجيا المعلومات والخدمات الرقمية، وهو ما ظهر جليًا من خلال الشراكات الاستراتيجية التي عقدها جهاز مستقبل مصر مع أكبر الشركات العالمية والمحلية مثل هواوي، السويدي إليكتريك، سيمنز، وشنايدر إلكتريك، وغيرهم من الشراكات الجاري دراستها. وهي شراكات تستهدف توطين التكنولوجيا وتقديم حلول رقمية ذكية في قطاعات متعددة.نحو مصر الرقميةبافتتاح هذه المرحلة من المدينة الصناعية، ومع انطلاق مشروعات التحول الرقمي داخل الجهاز، تُثبت مصر أنها ماضية بقوة نحو بناء اقتصاد رقمي متكامل، وأن "مستقبل مصر" لم يعد مجرد مشروع زراعي، بل أصبح نموذجًا فريدًا للتنمية الذكية التي تدمج بين الزراعة والصناعة والتكنولوجيا، من أجل بناء وطن قوي، مستقل، ومتصل بالعالم.

مصرس
منذ 32 دقائق
- مصرس
مين على حق .. رأي الشارع المصري في تعديلات قانون الإيجار القديم
جدل كبير في الشارع المصري بعد إقرار قانون الايجار القديم ، والذي يعد صدمة كبيرة للبعض وانفراجة للبعض الآخر ، فهناك تباين في الاراء بين الملاك والمستأجرين، المالك يرى أن الإيجار القديم يقتص من حقه بالتصرف في ممتلكاته التي يقوم بتأجيرها بمبالغ زهيدة تتراوح ما بين 3 إلى 6 جنيهات إيجار شهري ، بينما يخشي المستأجرون من تعديلات القانون والتي يتبعها زيادة كبيرة في الإيجار قد لا يستطيعون تحملها في ظل الظروف المعيشية الصعبة .. ما بين هذا وذلك كان للشارع المصري رأي أخر نرصده في التقرير التالي: وقد جاء في مشروع قانون الإيجار القديم فى 8 مواد، حيث نص مشروع القانون فى المادة (1) على أن تسرى أحكام هذا القانون على الأماكن المؤجرة لغرض السكنى والأماكن المؤجرة للأشخاص الطبيعية لغير غرض السكنى وفقا لأحكام القانونين رقمى 49 لسنة 1977 في شأن تأجير وبيع الأماكن وتنظيم العلاقة بين المؤجر والمستأجر؛ و136 لسنة 1981 في شأن بعض الأحكام الخاصة بتأجير وبيع الأماكن وتنظيم العلاقة بين المؤجر والمستأجر.وقد نصت المادة (2) على أنه اعتبارًا من موعد استحقاق الأجرة الشهرية التالية لتاريخ العمل بهذا القانون تكون القيمة الايجارية القانونية للأماكن المؤجرة لغرض السكنى عشرين مثل القيمة الايجارية القانونية السارية؛ على ألا تقل القيمة الإيجارية القانونية المستحقة شهريًا بعد الزيادة عن مبلغ ألف جنيه للوحدات الكائنة في المدن والأحياء؛ وعن مبلغ خمسمائة جنيه للوحدات الكائنة في القرى التي تسرى عليها أحكام القانونين رقمي 49 لسنة 1977 و136 لسنة 1981 المشار إليهما.كما نصت المادة (3) أنه: اعتبارًا من موعد استحقاق الأجرة الشهرية التالية لتاريخ العمل بهذا القانون تكون القيمة الإيجارية القانونية للأماكن المؤجرة للأشخاص الطبيعية لغير غرض السكنى خمسة أمثال القيمة الايجارية القانونية السارية.ايضا نصت المادة (4) على أن تزاد سنويا بصفة دورية آخر قيمة ايجارية قانونية مستحقة وفق أحكام هذا القانون بنسبة (15%)ونصت المادة (5) على أن تنتهى عقود إيجار الأماكن الخاضعة لأحكام هذا القانون بانتهاء مدة خمس سنوات من تاريخ العمل به؛ ما لم يتم التراضي على الإنهاء قبل ذلك.كذلك نصت المادة (6)مع عدم الإخلال بأسباب الإخلاء المبينة بالمادة (18) من القانون رقم 136 لسنة 1981 المشار اليه؛ يلتزم المستأجر أو من امتد إليه عقد الإيجار؛ بحسب الأحوال؛ بإخلاء المكان المؤجر ورده إلى المالك أو المؤجر؛ بحسب الأحوال؛ فى نهاية المدة المبينة فى المادة (5) من هذا القانون؛ ما لم يتم التراضي على غير ذلك.وحال الامتناع عن الإخلاء يكون للمالك أو المؤجر؛ بحسب الأحوال؛ أن يطلب من قاضي الأمور الوقتية بالمحكمة الكائن في دائرتها العقار إصدار أمر بطرد الممتنع عن الإخلاء دون الإخلال بالحق في التعويض إن كان له مقتضى.ومع عدم الإخلال بحكم الفقرة السابقة يحق للمستأجر أو من امتد إليه عقد الإيجار؛ بحسب الأحوال؛ رفع دعوى موضوعية أمام المحكمة المختصة وفقًا للإجراءات المعتادة على ألا يترتب على رفع الدعوى الموضوعية وقف أمر قاضى الأمور الوقتية المشار إليه.ووفقا للمادة (7) يمنح المستأجرون أو من امتدت اليهم عقود الإيجار؛ بحسب الأحوال الذين تنتهي عقود ايجارها طبقا لأحكام هذا القانون أولوية فى الحصول على وحدات سكنية وغير سكنية؛ إيجار أو تمليك؛ من الوحدات المتاحة لدى الدولة؛ وفقا للقواعد والشروط والإجراءات التى يصدر بها قرار من رئيس مجلس الوزراء؛ بناء على عرض الوزير المختص بشئون الإسكان؛ خلال شهر من تاريخ العمل بأحكام هذا القانون؛ وذلك مع مراعاة الفئات الأكثر احتياجًا منهم.إقرأ أيضا .. البرلمان يبدأ مناقشة مشروع قانون الإيجار القديم