أحدث الأخبار مع #أليكساوسيري


البوابة العربية للأخبار التقنية
١٦-٠٤-٢٠٢٥
- البوابة العربية للأخبار التقنية
أمازون تكشف عن نموذج الذكاء الاصطناعي الصوتي Nova Sonic
كشفت شركة أمازون عن نموذجها الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي Nova Sonic، وهو مصمم للتعامل مع الصوت بنحو مباشر وتوليد كلام طبيعي أقرب إلى المحادثات البشرية. وذكرت الشركة أن أداء هذا النموذج ينافس أبرز النماذج الصوتية المتقدمة من شركتي OpenAI وجوجل، وذلك وفقًا لمعايير تقيس السرعة ودقة تعرّف الكلام وجودة المحادثة. ويُعد Nova Sonic استجابة من أمازون للنماذج الصوتية الحديثة، مثل النموذج الذي يدعم وضع الصوت في ChatGPT، الذي بات أكثر سلاسة مقارنةً بالنماذج السابقة، مثل الإصدارات الأولى من أليكسا وسيري. وقد أسهمت الطفرات التقنية الأخيرة في جعل المساعدات الصوتية التقليدية مثل أليكسا وسيري تبدو متأخرة من ناحية الواقعية والطبيعية في التفاعل. ويتوفر نموذج Nova Sonic عبر منصة أمازون Bedrock المخصصة للمطورين لبناء تطبيقات الذكاء الاصطناعي للمؤسسات، وذلك من خلال واجهة برمجة تطبيقات API جديدة تتيح البث الصوتي في الاتجاهين. وفي بيانٍ رسمي، وصفت أمازون هذا النموذج بأنه 'الأكثر كفاءة من ناحية التكلفة' في السوق، مشيرةً إلى أنه أقل تكلفة بنسبة تقارب 80% مقارنةً بنموذج GPT-4o من OpenAI. وأكد روهيت براساد، النائب الأول لرئيس أمازون وكبير علماء الذكاء الاصطناعي العام (AGI) في الشركة، أن مكونات Nova Sonic تُستخدم بالفعل في تشغيل أليكسا بلس، المساعد الصوتي المحسّن الذي أطلقته الشركة حديثًا. ويتميّز Nova Sonic كذلك بقدرته على الاستجابة في الوقت المناسب في أثناء الحوارات الثنائية، إذ يراعي مدد الصمت والمقاطعات من الطرف الآخر، كما يولّد نسخة مكتوبة من كلام المستخدم، يمكن للمطورين الاستفادة منها في تطبيقات مختلفة. وبحسب براساد، فإن النموذج أقل عرضة لأخطاء تعرّف الكلام مقارنةً بالنماذج الأخرى، إذ يتمكن من فهم نوايا المستخدم حتى في حال تمتمته أو حديثه وسط ضوضاء. وعبر معيار Multilingual LibriSpeech لاختبار تعرّف الكلام عبر لغات ولهجات مختلفة، سجّل Nova Sonic معدل خطأ بلغ 4.2% فقط عند متوسط الأداء عبر اللغات الإنجليزية والفرنسية والإيطالية والألمانية والإسبانية. وعبر معيار آخر يُعرف باسم Augmented Multi Party Interaction لاختبار دقة التعرف الصوتي في حوارات متعددة الأطراف بمستوى صوت مرتفع، تفوق Nova Sonic بنسبة قدرها 46.7% من ناحية معدل الخطأ مقارنةً بنموذج GPT-4o-transcribe من OpenAI. ويُسجّل النموذج سرعة استجابة رائدة في القطاع، بمتوسط تأخير محسوس قدره 1.09 ثانية، مقارنة بـ1.18 ثانية لنموذج Realtime API من OpenAI، وفقًا لاختبارات أجرتها مؤسسة Artificial Analysis. ويُعد نموذج Nova Sonic جزءًا من إستراتيجية أمازون الواسعة لتطوير الذكاء الاصطناعي العام (AGI)، الذي تُعرّفه الشركة بأنه 'الذكاء الاصطناعي القادر على أداء كافة المهام التي ينفذها البشر عبر الحاسوب'. وأوضح براساد أن الشركة تعتزم مستقبلًا إطلاق نماذج ذكاء اصطناعي قادرة على فهم وسائط متعددة، تشمل الصور والفيديو والصوت، إلى جانب 'بيانات حسية أخرى' قد تُستخدم في تطبيقات واقعية. وتُشير هذه الخطوة إلى تنامي دور قسم الذكاء الاصطناعي العام AGI في منتجات أمازون، إذ كانت الشركة قد أطلقت حديثًا نموذج Nova Act، وهو نموذج ينفذ المهام عبر المتصفح، ويُعد جزءًا من مزايا أليكسا بلس، وميزة 'اشترِ نيابةً عني' التي تمكّن الذكاء الاصطناعي من التسوق نيابةً عن المستخدمين، بالإضافة إلى نموذج توليد الفيديو الجديد Nova Reel.


عرب هاردوير
١٠-٠٤-٢٠٢٥
- عرب هاردوير
نموذج أمازون الصوتي Nova Sonic: يجعل الآلات تتحدث كالبشر!
كشفت شركة أمازون عن نموذج Nova Sonic الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي، والذي يهدف إلى تقديم تجربة صوتية مُتطورة تشبه المُحادثات البشرية الطبيعية. يأتي هذا النموذج كجزء من جهود أمازون لتعزيز قدراتها في مجال الذكاء الاصطناعي، مع التركيز على تحسين أداء المُساعدات الصوتية وتلبية احتياجات المُطورين والمؤسسات. اقرأ أيضًا: Nova Sonic: أداء تنافسي أعلنت أمازون أنّ Nova Sonic يُنافس أبرز النماذج الصوتية من شركتيّ OpenAI وجوجل، حيث يتفوق في معايير السرعة، ودقة التعرُّف على الكلام، وجودة التفاعل في المحادثات. ويُعتبر هذا النموذج ردًا مُباشرًا على التقدُّم الملحوظ في نماذج مثل وضع الصوت في ChatGPT ، الذي أصبح أكثر سلاسة مُقارنةً بالإصدارات القديمة من أليكسا وسيري. وبفضل التطورات التكنولوجية الحديثة، باتت المساعدات الصوتية التقليدية تبدو أقل واقعية مُقارنةً بهذا الجيل الجديد من النماذج. تقنيات مُتطورة وتكلفة مُنخفضة يتوفر Nova Sonic عبر منصة Amazon Bedrock ، التي تتيح للمُطورين بناء تطبيقات ذكاء اصطناعي مُتقدمة باستخدام واجهة برمجة تطبيقات (API) تدعم البث الصوتي الثنائي. وصفت أمازون النموذج بأنه الأكثر كفاءة من حيث التكلفة في السوق، حيث يُقلل التكاليف بنسبة تصل إلى 80⁒ مُقارنةً بنموذج GPT-4o من OpenAI. وأكّد روهيت براساد -كبير علماء الذكاء الاصطناعي العام في أمازون- أنّ Nova Sonic يُستخدم حاليًا في تشغيل "Alexa Plus"، وهو الإصدار المُحسن من المساعد الصوتي. قدرات استثنائية في التعرف على الكلام يتميز Nova Sonic بقدرته على التعامل مع الحوارات الثنائية بسلاسة، مع مُراعاة فترات الصمت والمُقاطعات، وتوليد نصوص مكتوبة من كلام المُستخدم. سجل النموذج مُعدّل خطأ مُنخفض يبلغ 4.2⁒ في اختبار "Multilingual LibriSpeech" عبر عدّة لغات، بما في ذلك الإنجليزية والفرنسية والإسبانية. كما تفوق بنسبة 46.7⁒ على نموذج GPT-4o-transcribe في اختبار الحوارات مُتعددة الأطراف. ويُحقّق سُرعة استجابة مُميزة تبلغ 1.09 ثانية فقط، وفقًا لتقييمات مؤسسة Artificial Analysis. يندرج Nova Sonic ضمن إستراتيجية أمازون لتطوير الذكاء الاصطناعي العام (AGI) ، الذي يهدف إلى تمكين الآلات من أداء المهام البشرية بكفاءة. وتخطط الشركة لإطلاق نماذج مُستقبلية تدعم وسائط مُتعددة تشمل الصور والفيديو، إلى جانب تطبيقات عملية مثل "Nova Act" لتنفيذ المهام عبر المُتصفح، و Nova Reel لتوليد الفيديو، بهدف تعزيز مكانتها في سوق الذكاء الاصطناعي.


أخبار مصر
١٠-٠٤-٢٠٢٥
- أخبار مصر
نموذج أمازون الصوتي Nova Sonic: يجعل الآلات تتحدث كالبشر
نموذج أمازون الصوتي Nova Sonic: يجعل الآلات تتحدث كالبشر كشفت شركة أمازون عن نموذج Nova Sonic الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي، والذي يهدف إلى تقديم تجربة صوتية مُتطورة تشبه المُحادثات البشرية الطبيعية.يأتي هذا النموذج كجزء من جهود أمازون لتعزيز قدراتها في مجال الذكاء الاصطناعي، مع التركيز على تحسين أداء المُساعدات الصوتية وتلبية احتياجات المُطورين والمؤسسات. Nova Sonic: أداء تنافسي أعلنت أمازون أنّ Nova Sonic يُنافس أبرز النماذج الصوتية من شركتيّ OpenAI وجوجل، حيث يتفوق في معايير السرعة، ودقة التعرُّف على الكلام، وجودة التفاعل في المحادثات.ويُعتبر هذا النموذج ردًا مُباشرًا على التقدُّم الملحوظ في نماذج مثل وضع الصوت في ChatGPT، الذي أصبح أكثر سلاسة مُقارنةً بالإصدارات القديمة من أليكسا وسيري. وبفضل التطورات التكنولوجية الحديثة، باتت المساعدات الصوتية التقليدية تبدو أقل واقعية مُقارنةً بهذا الجيل الجديد من النماذج.تقنيات مُتطورة وتكلفة مُنخفضة يتوفر Nova Sonic عبر منصة Amazon Bedrock، التي تتيح للمُطورين بناء تطبيقات ذكاء اصطناعي مُتقدمة باستخدام واجهة برمجة تطبيقات (API) تدعم البث الصوتي الثنائي.وصفت أمازون النموذج بأنه الأكثر كفاءة من حيث التكلفة…..لقراءة المقال بالكامل، يرجى الضغط على زر 'إقرأ على الموقع الرسمي' أدناه


أخبار مصر
٠٩-٠٤-٢٠٢٥
- أعمال
- أخبار مصر
أمازون تكشف عن نموذج الذكاء الاصطناعي الصوتي Nova Sonic
أمازون تكشف عن نموذج الذكاء الاصطناعي الصوتي Nova Sonic كشفت شركة أمازون عن نموذجها الصوتي الجديد القائم على الذكاء الاصطناعي التوليدي Nova Sonic، وهو مصمم للتعامل مع الصوت بنحو مباشر وتوليد كلام طبيعي أقرب إلى المحادثات البشرية.وذكرت الشركة أن أداء هذا النموذج ينافس أبرز النماذج الصوتية المتقدمة من شركتي OpenAI وجوجل، وذلك وفقًا لمعايير تقيس السرعة ودقة تعرّف الكلام وجودة المحادثة. ويُعد Nova Sonic استجابة من أمازون للنماذج الصوتية الحديثة، مثل النموذج الذي يدعم وضع الصوت في ChatGPT، الذي بات أكثر سلاسة مقارنةً بالنماذج السابقة، مثل الإصدارات الأولى من أليكسا وسيري.وقد أسهمت الطفرات التقنية الأخيرة في جعل المساعدات الصوتية التقليدية مثل أليكسا وسيري تبدو متأخرة من ناحية الواقعية والطبيعية في التفاعل.ويتوفر نموذج Nova Sonic عبر منصة أمازون Bedrock المخصصة للمطورين لبناء تطبيقات الذكاء الاصطناعي للمؤسسات، وذلك من خلال واجهة برمجة تطبيقات API جديدة تتيح البث الصوتي في الاتجاهين.وفي بيانٍ رسمي، وصفت أمازون هذا النموذج بأنه الأكثر كفاءة من ناحية التكلفة في السوق، مشيرةً إلى أنه أقل تكلفة بنسبة تقارب 80% مقارنةً بنموذج GPT-4o من OpenAI.وأكد روهيت براساد، النائب الأول لرئيس أمازون وكبير علماء الذكاء الاصطناعي العام (AGI) في الشركة، أن مكونات Nova Sonic تُستخدم بالفعل في تشغيل أليكسا بلس، المساعد الصوتي المحسّن الذي أطلقته الشركة حديثًا.ويتميّز Nova Sonic كذلك بقدرته على الاستجابة في الوقت المناسب في أثناء الحوارات الثنائية، إذ يراعي مدد الصمت والمقاطعات من الطرف الآخر، كما يولّد نسخة مكتوبة من كلام المستخدم، يمكن للمطورين الاستفادة منها في تطبيقات…..لقراءة المقال بالكامل، يرجى الضغط على زر 'إقرأ على الموقع الرسمي' أدناه


حدث كم
٠٤-٠٤-٢٠٢٥
- صحة
- حدث كم
باحثون يطورون جهازا معززا بالذكاء الاصطناعي يترجم الأفكار إلى كلام منطوق
نجح باحثون من جامعة كاليفورنيا في تطوير جهاز معزز بالذكاء الاصطناعي، يحتوي على شريحة تمكن من ترجمة الأفكار إلى كلام منطوق في أجزاء من الثانية، و نشرت تفاصيل التقنية الجديدة، ضمن دراسة علمية في دورية 'نيتشر نيوروساينس'. وصمم الباحثون نظاما يعتمد على الذكاء الاصطناعي لتحويل الإشارات العصبية مباشرة إلى كلام منطوق، بما يوازي سرعة الاستجابة في الأجهزة الذكية مثل 'أليكسا' و'سيري'. وأكد الباحث الرئيسي في الدراسة، جوبالا أنومانشيبالي، أن 'النهج الذي اتبعناه في البث اللحظي يمكن من الوصول إلى قدرات فك شيفرة الكلام بسرعة تقارب تلك التي تتمتع بها الأجهزة الذكية، لكنه يطبق هذه الإمكانيات في أطراف عصبية مخصصة لذوي الإعاقات'. وقال أحد القائمين على الدراسة، تشيول جون تشو، إن 'النظام لا يقوم بقراءة الأفكار الأولية، وإنما يبدأ في تفسير النشاط العصبي بعد أن يكون المتحدث قد حدد ما يريد قوله، واختار الكلمات المناسبة، واستعد لتحريك عضلات النطق'. وقد أجريت التجارب على سيدة مريضة، حيث تم ربط الشريحة الدماغية بجهاز مخصص لتوليد الصوت، وفي أثناء التجربة، كانت المريضة تنظر إلى شاشة تعرض عبارات مثل: 'مرحبا، كيف حالك'، ثم تحاول تكرار العبارة بصمت، دون إصدار صوت. واعتبر الباحثون أن هذا الأمر يمثل خطوة رائدة في مجال الأطراف العصبية الخاصة بالنطق. وأشار جون تشو إلى أن 'هذا الإطار التمهيدي يمثل بالفعل اختراقا علميا، ونحن متفائلون بإمكان تحقيق تطورات ملموسة على كافة المستويات التقنية'. يذكر أنه في السنوات الأخيرة، شهد مجال تطوير الشرائح الدماغية تقدما ملحوظا، مع سعي العديد من الشركات إلى ابتكار تقنيات تعزز التواصل البشري، وتعالج التحديات الطبية.