أحدث الأخبار مع #AppleM2


سواليف احمد الزعبي
١٣-٠٥-٢٠٢٥
- علوم
- سواليف احمد الزعبي
سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد
#سواليف طوّر باحثون من جامعة واشنطن الأميركية #نظام_سماعات_رأس #ذكية يمكنها #ترجمة_حديث عدة أشخاص في الوقت نفسه، مع الحفاظ على نبرة صوت كل متحدث واتجاه صوته بدقة ثلاثية الأبعاد، حتى أثناء حركته. وأوضح الباحثون أن النظام، الذي أُطلق عليه «الترجمة الصوتية المكانية» قد يُحدث نقلة نوعية في مجال الترجمة الفورية. ونُشرت النتائج، الجمعة، في دورية «جمعية الحوسبة الأميركية (ACM)». وعلى الرغم من ظهور تقنيات واعدة في مجال الترجمة الفورية مؤخراً، فإن أياً منها لم يوفر حلاً فعّالاً في الأماكن العامة. فعلى سبيل المثال، تعمل نظارات شركة ميتا الجديدة فقط عند وجود متحدث واحد، وتعرض الترجمة الصوتية الآلية بعد انتهاء المتحدث من الكلام. لكن الفريق المصمم للنظام الجديد ابتكر حلاً يُترجم كلام عدة متحدثين في الوقت نسه مع الحفاظ على الاتجاه وخصائص كل صوت. ويعتمد النظام على سماعات مانعة للضوضاء مُزوّدة بميكروفونات، وتعمل خوارزميات النظام المستندة إلى الذكاء الاصطناعي على فصل أصوات المتحدثين وتتبعهم داخل المكان، ثم ترجمة كلامهم وإعادة تشغيله بصوت يشبه صوتهم الأصلي مع تأخير بسيط يتراوح بين 2 و4 ثوانٍ. ويتميز النظام بثلاثة ابتكارات رئيسية، أولها قدرته على اكتشاف عدد المتحدثين تلقائياً داخل أي مساحة مغلقة أو مفتوحة، من خلال مسح محيطي بزاوية 360 درجة، وترجمة الكلام مع الحفاظ على تعبيرات الصوت ومستوى ارتفاعه، باستخدام معالجات داخلية مثل شريحة (Apple M2)، دون الاعتماد على الحوسبة السحابية لحماية الخصوصية، بالإضافة إلى متابعة تحركات رؤوس المتحدثين، مع تعديل اتجاه الصوت تبعاً لحركتهم. وبمشاركة 29 متطوعاً، اختُبر النظام في 10 بيئات مختلفة داخلية وخارجية، مثل الشوارع، والمقاهي، والمتاحف، وأماكن عامة، وأثبت فاعليته في هذه البيئات الواقعية، حتى مع وجود ضوضاء خلفية. وركزت التجربة على 3 لغات هي الإسبانية، والألمانية، والفرنسية، وأظهر النظام أداء جيداً في الترجمة من هذه اللغات إلى الإنجليزية، والعكس. وأظهرت النتائج أن معظم المستخدمين فضّلوا نظام الترجمة الجديد على الأنظمة التقليدية؛ لما وفره من دقة عالية في الترجمة وتجربة سمعية طبيعية تُحاكي الواقع. كذلك أثبت النظام كفاءته العالية في تتبُّع المتحدثين وتحديد عددهم بدقة، حتى مع تحركهم، مع الحفاظ على اتجاه كل صوت وخصائصه التعبيرية بشكل منفصل. وقال الباحثون إن النظام يمكّن المستخدمين من فهم ما يقوله عدة أشخاص في الوقت نفسه بلغات مختلفة، في بيئة مزدحمة، مع الحفاظ على أصواتهم الأصلية وتحديد مَن قال ماذا، بما يفتح آفاقاً جديدة للسياحة، والتعليم، والتفاعل الثقافي. ويأمل الفريق بأن يسهم هذا الابتكار، الذي يمكن توسيعه ليشمل نحو 100 لغة، في كسر الحواجز اللغوية بين الثقافات، ليتمكن المستخدم من فهم ما يدور حوله بلغته.


أخبارنا
١٢-٠٥-٢٠٢٥
- علوم
- أخبارنا
ابتكار سماعات رأس ثورية لترجمة حديث عدة أشخاص في الوقت ذاته
نجح باحثون في جامعة واشنطن بالولايات المتحدة في تطوير نظام مبتكر لسماعات الرأس، قادر على ترجمة حديث عدة أشخاص في الوقت نفسه، مع الحفاظ على طبيعة أصواتهم واتجاهاتها، حتى أثناء تحركهم داخل المكان. ويُطلق على هذا الابتكار اسم "ترجمة الكلام المكانية" (Spatial Speech Translation)، حيث يعتمد على سماعات رأس مزودة بخاصية إلغاء الضوضاء وميكروفونات مدمجة، إلى جانب خوارزميات ذكية تفصل بين المتحدثين وتتعرف على مواقعهم بدقة. وأوضح الأستاذ شيام غولاكوتا، من قسم علوم الحاسوب والهندسة بالجامعة، أن التقنيات الحالية للترجمة الفورية تفترض وجود متحدث واحد فقط، مما يؤدي إلى صوت آلي موحد لا يعكس طبيعة الحوار أو اتجاهات المتحدثين، بينما يتيح الابتكار الجديد الحفاظ على طابع صوت كل متحدث وموقعه في الفضاء الصوتي. ويتميز النظام بثلاث ميزات رئيسية: رصد المتحدثين تلقائياً: يستطيع الجهاز اكتشاف عدد الأشخاص في أي مساحة، سواء كانت داخلية أو خارجية، عبر مسح بزاوية 360 درجة، مما يمكّنه من تحديد أماكن المتحدثين بدقة. الترجمة الفورية: يعيد تشغيل الحديث مترجماً بعد تأخير قصير يتراوح بين ثانيتين وأربع ثوانٍ، مع الحفاظ على التعبير الصوتي ومستوى الصوت الأصلي لكل شخص، مما يجعل الترجمة أكثر واقعية وانسيابية. تتبع ديناميكي للصوت: يقوم النظام بتتبع حركة رؤوس المتحدثين، ويتكيف مع التغيرات في اتجاه الصوت وخصائصه أثناء الحديث، مما يسمح بتجربة تفاعلية وطبيعية أكثر أثناء التنقل. وأكد توتشاو تشين، الباحث الرئيسي المشارك في المشروع، أن النظام يعمل بطريقة شبيهة بالرادار، حيث يقوم بمسح وتحليل البيئة المحيطة بشكل دائم، مما يمكنه من تحديد مواقع المتحدثين حتى في البيئات المعقدة والمزدحمة. ويُعد الابتكار متوافقاً مع أجهزة مثل Apple Vision Pro، وأجهزة الكمبيوتر المحمولة المزودة بشريحة Apple M2، دون الحاجة إلى الحوسبة السحابية، وهو خيار اتخذه الفريق لحماية الخصوصية ومنع إساءة استخدام تقنيات استنساخ الصوت. وقد أثبت النظام فعاليته في اختبارات شملت 10 بيئات مختلفة، داخلية وخارجية، حيث أبدى 29 مشاركاً تفضيلهم لهذه التقنية مقارنة بنماذج تقليدية لا توفر تتبعاً للمواقع أو تمييزاً للأصوات المتعددة.


خبرني
١٢-٠٥-٢٠٢٥
- علوم
- خبرني
سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد
خبرني - طوّر باحثون من جامعة واشنطن الأميركية نظام سماعات رأس ذكية يمكنها ترجمة حديث عدة أشخاص في الوقت نفسه، مع الحفاظ على نبرة صوت كل متحدث واتجاه صوته بدقة ثلاثية الأبعاد، حتى أثناء حركته. وأوضح الباحثون أن النظام، الذي أُطلق عليه «الترجمة الصوتية المكانية» قد يُحدث نقلة نوعية في مجال الترجمة الفورية. ونُشرت النتائج، الجمعة، في دورية «جمعية الحوسبة الأميركية (ACM)». وعلى الرغم من ظهور تقنيات واعدة في مجال الترجمة الفورية مؤخراً، فإن أياً منها لم يوفر حلاً فعّالاً في الأماكن العامة. فعلى سبيل المثال، تعمل نظارات شركة ميتا الجديدة فقط عند وجود متحدث واحد، وتعرض الترجمة الصوتية الآلية بعد انتهاء المتحدث من الكلام. لكن الفريق المصمم للنظام الجديد ابتكر حلاً يُترجم كلام عدة متحدثين في الوقت نسه مع الحفاظ على الاتجاه وخصائص كل صوت. ويعتمد النظام على سماعات مانعة للضوضاء مُزوّدة بميكروفونات، وتعمل خوارزميات النظام المستندة إلى الذكاء الاصطناعي على فصل أصوات المتحدثين وتتبعهم داخل المكان، ثم ترجمة كلامهم وإعادة تشغيله بصوت يشبه صوتهم الأصلي مع تأخير بسيط يتراوح بين 2 و4 ثوانٍ. ويتميز النظام بثلاثة ابتكارات رئيسية، أولها قدرته على اكتشاف عدد المتحدثين تلقائياً داخل أي مساحة مغلقة أو مفتوحة، من خلال مسح محيطي بزاوية 360 درجة، وترجمة الكلام مع الحفاظ على تعبيرات الصوت ومستوى ارتفاعه، باستخدام معالجات داخلية مثل شريحة (Apple M2)، دون الاعتماد على الحوسبة السحابية لحماية الخصوصية، بالإضافة إلى متابعة تحركات رؤوس المتحدثين، مع تعديل اتجاه الصوت تبعاً لحركتهم. وبمشاركة 29 متطوعاً، اختُبر النظام في 10 بيئات مختلفة داخلية وخارجية، مثل الشوارع، والمقاهي، والمتاحف، وأماكن عامة، وأثبت فاعليته في هذه البيئات الواقعية، حتى مع وجود ضوضاء خلفية. وركزت التجربة على 3 لغات هي الإسبانية، والألمانية، والفرنسية، وأظهر النظام أداء جيداً في الترجمة من هذه اللغات إلى الإنجليزية، والعكس. وأظهرت النتائج أن معظم المستخدمين فضّلوا نظام الترجمة الجديد على الأنظمة التقليدية؛ لما وفره من دقة عالية في الترجمة وتجربة سمعية طبيعية تُحاكي الواقع. كذلك أثبت النظام كفاءته العالية في تتبُّع المتحدثين وتحديد عددهم بدقة، حتى مع تحركهم، مع الحفاظ على اتجاه كل صوت وخصائصه التعبيرية بشكل منفصل. وقال الباحثون إن النظام يمكّن المستخدمين من فهم ما يقوله عدة أشخاص في الوقت نفسه بلغات مختلفة، في بيئة مزدحمة، مع الحفاظ على أصواتهم الأصلية وتحديد مَن قال ماذا، بما يفتح آفاقاً جديدة للسياحة، والتعليم، والتفاعل الثقافي. ويأمل الفريق بأن يسهم هذا الابتكار، الذي يمكن توسيعه ليشمل نحو 100 لغة، في كسر الحواجز اللغوية بين الثقافات، ليتمكن المستخدم من فهم ما يدور حوله بلغته.


جو 24
١٢-٠٥-٢٠٢٥
- علوم
- جو 24
سماعات ثورية تترجم عدة متحدثين في وقت واحد وتحافظ على أصواتهم الطبيعية
جو 24 : طوّر باحثون في جامعة واشنطن بالولايات المتحدة نظاماً متقدماً لسماعات الرأس قادراً على ترجمة حديث عدة أشخاص في الوقت ذاته، مع الحفاظ على طبيعة أصواتهم واتجاهاتها أثناء الحوار، حتى في حال تحركهم داخل المكان. ويحمل الابتكار اسم "ترجمة الكلام المكانية" (Spatial Speech Translation)، ويعتمد على سماعات رأس مزودة بخاصية إلغاء الضوضاء وميكروفونات مدمجة، إلى جانب خوارزميات ذكية تفصل بين المتحدثين وتتعرف على مواقعهم. وأوضح الأستاذ شيام غولاكوتا، من قسم علوم الحاسوب والهندسة بالجامعة، أن معظم تقنيات الترجمة الحالية تفترض وجود متحدث واحد فقط، ما يؤدي إلى صوت آلي موحد لا يعكس تعدد الأشخاص أو اتجاهاتهم. وأضاف: "لأول مرة، أصبح بإمكاننا الحفاظ على طابع صوت كل متحدث واتجاهه ضمن المجموعة". ويقدم النظام ثلاث ميزات رئيسية: رصد المتحدثين تلقائياً: يكتشف عدد الأشخاص في أي مساحة، داخلية كانت أم خارجية، عبر مسح بزاوية 360 درجة. الترجمة الفورية: يعيد تشغيل الحديث مترجماً بعد تأخير قصير يتراوح بين ثانيتين وأربع ثوانٍ، مع الحفاظ على التعبير الصوتي ومستوى الصوت الأصلي لكل متحدث. تتبع ديناميكي للصوت: يتابع النظام حركة رؤوس المتحدثين، ويتكيف مع التغيرات في اتجاه الصوت وخصائصه أثناء الحديث. وقال توتشاو تشين، الباحث الرئيسي المشارك وطالب الدكتوراه في الجامعة، إن النظام يعمل بطريقة شبيهة بالرادار، ويقوم بمسح وتحليل البيئة المحيطة بشكل دائم لتحديد مواقع المتحدثين بدقة. ويعمل النظام حالياً على أجهزة مثل Apple Vision Pro، وأجهزة الكمبيوتر المحمولة المزودة بشريحة Apple M2، دون الحاجة إلى الحوسبة السحابية، وهو خيار اتخذه الفريق لحماية الخصوصية ومنع إساءة استخدام تقنيات استنساخ الصوت. وأثبت النظام فعاليته في اختبارات شملت 10 بيئات مختلفة داخلية وخارجية، كما أبدى 29 مشاركاً تفضيلهم لهذا الابتكار، مقارنة بنماذج لا تتيح تتبع المتحدثين. تابعو الأردن 24 على


الصحراء
١١-٠٥-٢٠٢٥
- علوم
- الصحراء
سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد
طوّر باحثون من جامعة واشنطن الأميركية نظام سماعات رأس ذكية يمكنها ترجمة حديث عدة أشخاص في الوقت نفسه، مع الحفاظ على نبرة صوت كل متحدث واتجاه صوته بدقة ثلاثية الأبعاد، حتى أثناء حركته. وأوضح الباحثون أن النظام، الذي أُطلق عليه «الترجمة الصوتية المكانية» قد يُحدث نقلة نوعية في مجال الترجمة الفورية. ونُشرت النتائج، الجمعة، في دورية «جمعية الحوسبة الأميركية (ACM)». وعلى الرغم من ظهور تقنيات واعدة في مجال الترجمة الفورية مؤخراً، فإن أياً منها لم يوفر حلاً فعّالاً في الأماكن العامة. فعلى سبيل المثال، تعمل نظارات شركة ميتا الجديدة فقط عند وجود متحدث واحد، وتعرض الترجمة الصوتية الآلية بعد انتهاء المتحدث من الكلام. لكن الفريق المصمم للنظام الجديد ابتكر حلاً يُترجم كلام عدة متحدثين في الوقت نسه مع الحفاظ على الاتجاه وخصائص كل صوت. ويعتمد النظام على سماعات مانعة للضوضاء مُزوّدة بميكروفونات، وتعمل خوارزميات النظام المستندة إلى الذكاء الاصطناعي على فصل أصوات المتحدثين وتتبعهم داخل المكان، ثم ترجمة كلامهم وإعادة تشغيله بصوت يشبه صوتهم الأصلي مع تأخير بسيط يتراوح بين 2 و4 ثوانٍ. ويتميز النظام بثلاثة ابتكارات رئيسية، أولها قدرته على اكتشاف عدد المتحدثين تلقائياً داخل أي مساحة مغلقة أو مفتوحة، من خلال مسح محيطي بزاوية 360 درجة، وترجمة الكلام مع الحفاظ على تعبيرات الصوت ومستوى ارتفاعه، باستخدام معالجات داخلية مثل شريحة (Apple M2)، دون الاعتماد على الحوسبة السحابية لحماية الخصوصية، بالإضافة إلى متابعة تحركات رؤوس المتحدثين، مع تعديل اتجاه الصوت تبعاً لحركتهم. وبمشاركة 29 متطوعاً، اختُبر النظام في 10 بيئات مختلفة داخلية وخارجية، مثل الشوارع، والمقاهي، والمتاحف، وأماكن عامة، وأثبت فاعليته في هذه البيئات الواقعية، حتى مع وجود ضوضاء خلفية. وركزت التجربة على 3 لغات هي الإسبانية، والألمانية، والفرنسية، وأظهر النظام أداء جيداً في الترجمة من هذه اللغات إلى الإنجليزية، والعكس. وأظهرت النتائج أن معظم المستخدمين فضّلوا نظام الترجمة الجديد على الأنظمة التقليدية؛ لما وفره من دقة عالية في الترجمة وتجربة سمعية طبيعية تُحاكي الواقع. كذلك أثبت النظام كفاءته العالية في تتبُّع المتحدثين وتحديد عددهم بدقة، حتى مع تحركهم، مع الحفاظ على اتجاه كل صوت وخصائصه التعبيرية بشكل منفصل. وقال الباحثون إن النظام يمكّن المستخدمين من فهم ما يقوله عدة أشخاص في الوقت نفسه بلغات مختلفة، في بيئة مزدحمة، مع الحفاظ على أصواتهم الأصلية وتحديد مَن قال ماذا، بما يفتح آفاقاً جديدة للسياحة، والتعليم، والتفاعل الثقافي. ويأمل الفريق بأن يسهم هذا الابتكار، الذي يمكن توسيعه ليشمل نحو 100 لغة، في كسر الحواجز اللغوية بين الثقافات، ليتمكن المستخدم من فهم ما يدور حوله بلغته. نقلا عن الشرق الأوسط