أحدث الأخبار مع #TTS


الوفد
منذ 15 ساعات
- الوفد
جوجل تطلق ميزة نص إلى كلام تدعم تبديل اللغات بسلاسة
تُحسّن جوجل ميزة تحويل النص إلى كلام (TTS) في جهاز جيميني، يوم الثلاثاء، خلال مؤتمر جوجل للمطورين 2025، استعرضت الشركة ميزة جديدة لتحويل النص إلى كلام، مبنية على إخراج صوتي أصلي، تُمكّن من "التحدث بطرق أكثر تعبيرًا". قدّم تولسي دوشي، من جوجل، عرضًا توضيحيًا سريعًا لنماذج جيميني 2.5 TTS على خشبة المسرح في ماونتن فيو. أظهر العرض صوتًا مُدعّمًا بالذكاء الاصطناعي يبدو أكثر طبيعية وأقل آلية، مع فروق دقيقة. يستطيع جهاز تحويل النص إلى كلام التحدث بأكثر من 24 لغة، والتبديل بينها بسلاسة. أظهر العرض التوضيحي النموذج يبدأ باللغة الإنجليزية، ثم ينتقل إلى الهندية، ثم يعود إلى الإنجليزية. استخدمت جميعها نفس الصوت، مما يُوحي بأنه نفس "الشخص". كما يُمكن لجهاز تحويل النص إلى كلام (TTS) التبديل إلى صوت همس (بدا غريبًا بعض الشيء) بسلاسة. تتوفر ميزة تحويل النص إلى كلام الجديدة ابتداءً من اليوم في واجهة برمجة تطبيقات جيميني. كما ستتوفر واجهة برمجة تطبيقات جيميني لايف يوم الثلاثاء أيضًا معاينة لإصدار فلاش 2.5 للحوار الصوتي الأصلي.


النهار
٢٤-٠٣-٢٠٢٥
- النهار
احذر... الذكاء الاصطناعي يمكنه تقليد صوتك بدقة مذهلة!
أصبح الذكاء الاصطناعي (AI) قادراً على تقليد أصوات المشاهير لقراءة قصص ما قبل النوم للأطفال، أو إعادة إنشاء صوت أحد الأحباء الراحلين لسرد ذكريات جميلة، أو حتى استنساخ صوتك الشخصي للتحدث بطلاقة بلغات لم تتعلمها أبداً. يُعرف الصوت الاصطناعي بالذكاء الاصطناعي، أو ما يُسمى بتوليد الصوت (Voice Synthesis)، بأنه تقنية تستخدم الذكاء الاصطناعي لإنتاج صوت بشري طبيعي. وقد شهدت هذه التكنولوجيا تطوراً ملحوظاً منذ إطلاق "شات جي بي تي" في أواخر عام 2022. التطور الثوري لتقنية الصوت الاصطناعي إمكانية استنساخ الأصوات البشرية تُعد اختراقاً تقنياً. تخيل أن يتمكن كاتبك المفضل من إلقاء كتابه الجديد بصوته الحقيقي، أو أن يتحدث معك وكيل خدمة عملاء بصوت يناسب لهجتك المحلية، حتى وإن كان يبعد عنك آلاف الأميال. هذه التطبيقات تعكس الإمكانات التحويلية لتكنولوجيا الصوت الاصطناعي. لقد أحدثت هذه التقنية ثورة في طريقة تفاعلنا مع الآلات، وإنتاج المحتوى، والتواصل. قبل استعراض التطبيقات المختلفة لتوليد الصوت الاصطناعي، من المهم فهم كيفية إنتاجه. مراحل إنشاء الصوت الاصطناعي بالذكاء الاصطناعي تمر عملية إنشاء الصوت الاصطناعي بأربع مراحل رئيسية: 1. جمع البيانات تعتمد أنظمة الصوت الاصطناعي على بيانات صوتية عالية الجودة. هذه المرحلة الأساسية تتطلب جمع مجموعة كبيرة ومتنوعة من العينات الصوتية لتدريب النموذج بفعالية. على سبيل المثال، تقوم شركات مثل "أمازون" بجمع أوامر صوتية من المستخدمين عند استخدام مساعدها الصوتي "أليكسا"، حيث تساعد هذه البيانات في تدريب النماذج على أنماط الكلام الطبيعية. ومع ذلك، تأتي عملية جمع البيانات مع عدة تحديات: مخاوف الخصوصية: قد تثير تسجيلات المستخدمين مع المساعدات الصوتية مخاوف بشأن الخصوصية. التحيز في البيانات: إذا لم تكن البيانات الصوتية متنوعة كفاية، فقد يؤدي ذلك إلى نتائج غير متوازنة. على سبيل المثال، إذا كان معظم التسجيلات من أصوات ذكورية، فقد يواجه الذكاء الاصطناعي صعوبة في إنشاء أصوات أنثوية. جودة البيانات: يجب أن تكون العينات الصوتية واضحة وخالية من التشويش لتدريب النموذج بشكل دقيق. 2. نمذجة الصوت بعد جمع البيانات، تبدأ مرحلة نمذجة الصوت، وهي جوهر العملية حيث يتعلم الكمبيوتر فهم وتعقيد الصوت البشري. يتم تحليل العينات الصوتية باستخدام خوارزميات الذكاء الاصطناعي، خاصة نماذج التعلم العميق (Deep Learning)، لفهم مكونات الصوت المختلفة. من الأمثلة البارزة لهذه التقنية نموذج WaveNet من غوغل، والذي يعتمد على تحليل الموجات الصوتية الأولية بدلاً من القواعد الصوتية التقليدية، ما يمكنه من التقاط التغيرات الطفيفة في نبرة الصوت، والإيقاع، والتنغيم، ما يجعل الصوت الناتج أقرب إلى الصوت البشري الطبيعي. 3. توليد الصوت بعد إنشاء النموذج الرقمي للصوت، يتم تحويله إلى صوت مسموع باستخدام تقنيات تحويل النص إلى كلام (TTS). على سبيل المثال، توفر منصة Azure AI من "مايكروسوفت" حلولاً متقدمة لإنشاء أصوات طبيعية للمساعدين الافتراضيين. التطورات الحديثة في هذا المجال سمحت بتطوير أنظمة النطق العصبي (Neural TTS)، التي تستطيع محاكاة العواطف البشرية، مثل رفع الصوت عند طرح سؤال، أو تغيير نبرة الصوت لتعكس مشاعر مختلفة. هذه الميزات تجعل التفاعل مع الأصوات الاصطناعية أكثر واقعية وسلاسة. 4. التخصيص والتكييف في هذه المرحلة، يتم تعديل الصوت الاصطناعي ليناسب احتياجات الأعمال المختلفة. على سبيل المثال، قد تحتاج علامة تجارية إلى صوت دافئ وودود، بينما تتطلب خدمة دعم تقني صوتاً واضحاً واحترافياً. تلعب التحسينات اللغوية والمحلية دوراً رئيسياً، حيث يجب أن تكون الأصوات ملائمة للسياقات المختلفة، مثل تمييز اللهجات الإقليمية بين الأسواق البريطانية والأميركية. كما يمكن تكييف الأصوات لضبط النغمة والإيقاع بما يتناسب مع ثقافة الجمهور المستهدف. أبرز تطبيقات الصوت الاصطناعي - المساعدات الصوتية والدردشة الآلية تساعد أنظمة الصوت الاصطناعي في تحسين تجربة المستخدم عبر المحادثات الآلية، كما هو الحال في البنوك والتجارة الإلكترونية. على سبيل المثال، يمكن أن يتحدث مساعد صوتي في بنك بنبرة ودودة لطمأنة العملاء عند الإبلاغ عن عمليات احتيالية. - استنساخ أصوات المشاهير يتم استخدام الذكاء الاصطناعي لإنشاء أصوات افتراضية لمشاهير، ما يتيح لهم "التحدث" في إعلانات أو حتى في أفلام جديدة دون الحاجة إلى تسجيل صوتي جديد. مثال على ذلك Celebrity Voice Generator، الذي يمكنه إعادة إنتاج أصوات المشاهير بدقة مذهلة. - الحفاظ على الأصوات التاريخية والطبية يمكن للذكاء الاصطناعي إعادة إنتاج أصوات الشخصيات التاريخية لاستخدامها في الوثائقيات. يمكن للأشخاص الذين فقدوا أصواتهم بسبب أمراض أو عمليات جراحية استعادة صوتهم باستخدام نماذج مخصصة. رغم الفوائد العديدة التي تقدمها تقنية توليد الصوت بالذكاء الاصطناعي، إلا أنها تحمل في طياتها مخاطر كبيرة. تتمثل أبرز هذه المخاطر في انتشار عمليات الاحتيال والتزييف العميق (Deepfake)، حيث يمكن استغلال هذه التقنية لإنشاء تسجيلات مزيفة لخداع الأفراد أو التلاعب بالمعلومات. ولمواجهة هذه المخاطر، تم تطوير تقنيات متخصصة لاكتشاف الأصوات المقلدة بالذكاء الاصطناعي. تعتمد هذه التقنيات على تحليل الأنماط الصوتية، والتعرف على الفروقات الدقيقة بين الصوت الطبيعي والصوت المولد بواسطة الذكاء الاصطناعي. من أبرز هذه الحلول: برمجيات كشف التزييف العميق، مثل أدوات Resemble AI Detect وDeepfake Detection. تحليل الطيف الصوتي الذي يحدد الاختلافات الدقيقة في الترددات الصوتية. استخدام تقنيات الذكاء الاصطناعي لمكافحة التزييف عبر مقارنة الصوت المُنتج بمصدر أصلي موثوق. مع استمرار تطور هذه التقنية، يظل من الضروري توخي الحذر واتخاذ إجراءات وقائية لضمان الاستخدام الأخلاقي والمسؤول للصوت الاصطناعي.


البيان
٠٨-٠٣-٢٠٢٥
- علوم
- البيان
بعد نشر الروبوت GSAi .. هل تنوي الحكومة الأمريكية تسريح المزيد من الموظفين؟
أعلنت وزارة كفاءة الحكومة الأمريكية (DOGE) عن نشر برنامج دردشة آلي يُدعى GSAi لخدمة 1500 موظف فيدرالي في إدارة الخدمات العامة (GSA)، وفقًا لتقرير نشرته مجلة WIRED. يأتي هذا الإجراء في إطار جهود الوزارة لأتمتة المهام التي كانت تُنفذ يدويًا، وذلك بالتزامن مع استمرارها في تقليص القوى العاملة الفيدرالية. تم تصميم GSAi لدعم المهام العامة، مشابهًا لأدوات الذكاء الاصطناعي التجارية مثل ChatGPT أو Claude من Anthropic. وقد تم تطويره ليكون آمنًا للاستخدام الحكومي، وفقًا لتصريحات أحد موظفي GSA لـ WIRED. ويهدف الفريق المسؤول عن البرنامج إلى استخدامه في تحليل بيانات العقود والمشتريات في المستقبل. ويطرح الخبراء تساؤلات حول الاستراتيجية الكامنة وراء هذه الخطوة، حيث يتساءل أحد خبراء الذكاء الاصطناعي، الذي فضل عدم الكشف عن اسمه، عما إذا كان الهدف هو تعميم استخدام الذكاء الاصطناعي ثم تسريح المزيد من الموظفين. وأضاف: "هذا لن يفاجئني". في فبراير الماضي، اختبرت DOGE البرنامج في تجربة أولية مع 150 مستخدمًا داخل GSA، وتخطط لنشره على نطاق أوسع في الوكالة. وقد تم تسريع عملية التطوير تحت إشراف القيادة الجديدة للوكالة. يتيح GSAi للموظفين الفيدراليين التفاعل مع واجهة مشابهة لـ ChatGPT، مع خيارات متعددة للنماذج اللغوية مثل Claude Haiku 3.5 وClaude Sonnet 3.5 v2 وMeta LLaMa 3.2، اعتمادًا على طبيعة المهمة. وتشير مذكرة داخلية إلى إمكانات البرنامج في كتابة مسودات البريد الإلكتروني، وإنشاء نقاط نقاش، وتلخيص النصوص، وحتى كتابة التعليمات البرمجية. ومع ذلك، تحذر المذكرة من إدخال معلومات فيدرالية غير عامة أو بيانات شخصية قابلة للتحديد. ويقول أحد الموظفين الذين جربوا البرنامج: "إنه يشبه المتدربين، حيث يقدم إجابات عامة وقابلة للتخمين". كما تدرس وزارة الخزانة ووزارة الصحة والخدمات الإنسانية استخدام روبوت محادثة مماثل في مراكز الاتصال الداخلية والخارجية. وفي سياق آخر، يستخدم الجيش الأمريكي أداة ذكاء اصطناعي تُسمى CamoGPT لمراجعة مواد التدريب وإزالة الإشارات المتعلقة بالتنوع والمساواة. في فبراير أيضًا، بدأت GSA ووزارة التعليم مشروعًا مشتركًا لتطوير برنامج دردشة آلي لوزارة الطاقة، لكن المشروع توقف لاحقًا. وفي اجتماع مع الموظفين، أعلن توماس شيد، المسؤول عن خدمات التحول التكنولوجي (TTS)، عن خفض عدد موظفي فرع التكنولوجيا بنسبة 50% خلال الأسابيع المقبلة، مع التركيز على مشاريع مثل و وأكد شيد على دعمه للذكاء الاصطناعي والأتمتة في الحكومة، مشيرًا إلى أن هذه التقنيات ستكون جزءًا أساسيًا من أجندة TTS.


البيان
٠٦-٠٢-٢٠٢٥
- أعمال
- البيان
كيف سيطر حلفاء إيلون ماسك على الوظائف الحيوية للحكومة الفيدرالية؟
تعمل إدارة ترامب على تحويل وحدة تكنولوجيا المعلومات الفيدرالية، إلى أداة رئيسية في جهودها لإصلاح البيروقراطية الحكومية، وأصبحت هذه الوحدة، التي تُعرف باسم "قسم خدمات التحول التكنولوجي" (TTS)، محورًا لاستراتيجية شاملة تهدف إلى إعادة هيكلة العمليات الفيدرالية، مما أثار مخاوف من تجاوزات محتملة وفوضى داخل أوساط موظفي التكنولوجيا الحكوميين. خلال اجتماع يوم الاثنين، استفسر موظفو TTS عن مستقبل الوكالة من توماس شيد، حليف إيلون ماسك والخريج السابق لشركة تسلا، الذي تم تعيينه مؤخرًا كمدير للوحدة. وأخبر شيد الموظفين أن الإدارة تراهم كـ"سكاكين الجيش السويسري" القادرين على تقديم خدمات عبر الوكالات الفيدرالية. وأكد أن الوحدة تُعتبر "المعيار الذهبي" لإنجاز الأعمال التقنية داخل الحكومة. لكن في خلفية هذه التصريحات المطمئنة، كان فريق ماسك يقيم بهدوء كفاءة وولاء الموظفين الحاليين لتحديد من سيتم الاحتفاظ بهم. وتكشف تعليقات شيد عن كيفية استغلال ماسك وحلفائه للوحدات التكنولوجية والوكالات الفيدرالية الأخرى لتوطيد السيطرة على السلطة التنفيذية. وقد استولت مجموعة ماسك بالفعل على مكتب البيت الأبيض المعروف سابقًا باسم "الخدمة الرقمية الأمريكية"، والذي تمت إعادة تسميته إلى "خدمة DOGE الأمريكية" في اليوم الأول لترامب في منصبه، كما يدير حلفاؤه إدارة الخدمات العامة، التي تشرف على العقارات والمشتريات وتكنولوجيا المعلومات، بالإضافة إلى مكتب إدارة الموظفين، الذي يتولى شؤون الموارد البشرية. وبفضل سيطرتهم على اللوجستيات، يتخذ الفريق إجراءات استثنائية لتقليص حجم الحكومة، بما في ذلك دفع استقالات جماعية، والوصول إلى نظام دفع وزارة الخزانة، والحصول على بيانات القروض الطلابية الفيدرالية، وتحدي وجود الوكالة الأمريكية للتنمية الدولية. وتعد وحدة TTS جزءًا من استراتيجية أوسع للسيطرة على البنية التحتية التقنية للحكومة الفيدرالية، التي تدعم كل شيء من تطبيقات التسجيل الحكومية إلى موقع إدارة الضمان الاجتماعي. وتحرك إدارة ترامب لوضع الموالين في مناصب قيادية تقنية، حيث أمرت إدارة شؤون الموظفين الوكالات الفيدرالية بإعادة تصنيف كبار مسؤولي المعلومات كمناصب سياسية يختارها الرئيس. وحتى وقت قريب، كانت مهمة TTS تتمثل في جعل المنصات الحكومية سهلة الاستخدام ومتاحة للجميع. وتضم الوحدة موظفين يعملون في جميع الوكالات، مما يجعلها أداة قوية لتحقيق هدف ماسك المتمثل في خفض الإنفاق الفيدرالي بمقدار تريليون دولار. ومع ذلك، يواجه الموظفون تحديات كبيرة، حيث أشار شيد إلى أن الوحدة قد تواجه تخفيضات في الموظفين على الرغم من الطلب المتزايد على خدماتها التقنية. وأكد أن الإدارة ستتحرك بسرعة لإجراء تخفيضات جذرية بحلول نهاية السنة المالية. وقد أثارت هذه التحركات مخاوف بين موظفي التكنولوجيا الحكوميين، الذين بدأوا في تنظيم جهود للدفاع عن حقوقهم وقيمهم. وأطلقت مجموعة "CivicTechStrong" مبادرة جديدة لتوحيد العاملين في مجال التكنولوجيا المدنية للدفاع عن تأثير عملهم وممارسة حقوقهم. وفي الوقت نفسه، يواصل فريق ماسك العمل بوتيرة سريعة، مستخدمًا أساليب مشابهة لتلك المستخدمة في شركاته الخاصة، بما في ذلك العمل لساعات طويلة وخفض التكاليف بشكل حاد. وقد أشار ماسك إلى أن فريقه يعمل 120 ساعة أسبوعيًا، مقارنة بـ 40 ساعة للبيروقراطيين الحكوميين، مما يمنحه ميزة تنافسية.