
"وضع الصوت المتقدم".. "تشات جي بي تي" يتحدث كالبشر
تحديث جديد لوضع "الصوت المتقدم" في "تشات جي بي تي" لا يضيف فقط تحسينات على النطق والاستجابة، بل يمنح الآلة شيئًا يشبه "الإحساس": نبرة، إيقاع، وتعبير يُحاكي التفاعل البشري الحقيقي.
اقرأ أيضاً...كيف تسأل الذكاء الاصطناعي؟.. 5 مفاتيح لإجابات أدق
من ردود دقيقة وسريعة، إلى تعبيرات عن التعاطف وحتى السخرية، يبدو أن "تشات جي بي تي" لم يعد مجرد نموذج نصي، بل صوت قادر على إجراء محادثات طبيعية وعاطفية… وربما قريبًا، لا يمكن تمييزها عن صوتك أو صوتي.
أعلنت شركة "أوبن أيه آي" عن تحديث كبير لوضع "الصوت المتقدم" (Advanced Voice Mode) في "تشات جي بي تي"، يهدف إلى جعل المحادثات الصوتية أكثر واقعية وطبيعية من أي وقت مضى. التحديث الجديد يعزز من قدرة النموذج على التفاعل الصوتي السلس، مع تعبيرات صوتية تُحاكي المحادثات البشرية الفعلية. بحسب موقع "Neowin" المتخصص في أخبار التكنولوجيا.
سرعة استجابة تُقارب الاستجابة البشرية
تم تقديم وضع الصوت المتقدم لأول مرة مع إطلاق نموذج GPT-4o، والذي يتمتع بقدرات متعددة الوسائط. يمكن للنموذج الآن الرد على المدخلات الصوتية في زمن قدره 232 ميلي ثانية فقط، وبمتوسط 320 ميلي ثانية، وهو ما يوازي تقريبًا سرعة الاستجابة البشرية في الحوارات اليومية.
صوت أكثر طبيعية وثراءً في التعبير
التحديث الجديد يضيف تحسينات نوعية على الصوت، تشمل:نغمة أكثر سلاسة وواقعية وإيقاع منطقي في الردود يشمل التوقفات والشدّة في الكلمات المهمة، مع قدرة أفضل على التعبير عن المشاعر مثل التعاطف أو السخرية
ماينتج تجربة صوتية أشبه بمحادثة مع شخص حقيقي، خصوصًا في المواقف العاطفية أو المعقدة.
الترجمة الصوتية التلقائية تصل إلى "تشات جي بي تي"
الميزة الأبرز في هذا التحديث هي الترجمة الفورية بين اللغات باستخدام الصوت. أصبح بإمكان المستخدم أن يطلب من "تشات جي بي تي" بدء الترجمة، وسيستمر النموذج في الترجمة طوال المحادثة من دون توقف حتى يُطلب منه ذلك. هذه الميزة تقلل من الحاجة إلى تطبيقات الترجمة الصوتية الأخرى وتُسهّل التواصل بين اللغات.
تحديات بالرغم من التقدم
بالرغم من التطويرات الكبيرة، لا تزال هناك بعض التحديات التي أشار إليها فريق"أوبن أيه آي"، منها: انخفاض طفيف في جودة الصوت أحيانًا، خاصة مع تغيّرات مفاجئة في النغمة أو الحدة مع ظهور أصوات غير مقصودة في حالات نادرة، مثل أصوات غير مفهومة أو تشبه الإعلانات أو الموسيقى
أوضحت "أوبن أيه آي" أنها تعمل على تحسين هذه النقاط تدريجيًا ضمن خطتها لتطوير النماذج الصوتية.
التحديث متاح فقط للمستخدمين المدفوعين
حتى الآن، يتوفر هذا التحديث فقط لمشتركي خطط "تشات جي بي تي" المدفوعة (Plus وEnterprise)، ولا يشمل المستخدمين المجانيين.
هل نقترب من محادثات لا يمكن تمييزها عن البشر؟
مع كل تحديث جديد، تقل المسافة بين الصوت البشري وصوت الآلة. "تشات جي بي تي" بات يفهم النبرة، يلتقط الإشارات غير اللفظية، ويستجيب بسرعة وبمشاعر واضحة. المستقبل القريب قد يشهد محادثات يصعب على الإنسان تمييزها عن التفاعل البشري الحقيقي.
ومع هذه القفزة في الصوت، لم يعد السؤال: "هل تتحدث الآلة؟" بل أصبح: "هل ما زلنا نُميز من يتحدث؟"
في ظل هذا التطور، لم يعد الذكاء الاصطناعي يكتفي بأن "يفهم" كلامنا، بل بات قادرًا على "قول" ما يشبهه — بنغمة، وشعور، وتفاعل.
لكن السؤال الذي يفرض نفسه الآن: هل نُطوّر صوتًا ذكيًا لمساعدتنا؟ أم أننا نقترب من خلق نسخة رقمية لا يمكن تمييزها عن الإنسان؟..
التحديث الجديد يقرّبنا من الإجابة… لكنه يفتح أيضًا الباب أمام تساؤلات أعمق حول مستقبل التفاعل بين البشر والآلة.
لمياء الصديق (أبوظبي)

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


الاتحاد
منذ يوم واحد
- الاتحاد
الذكاء الاصطناعي.. الرجل المُطيع تماماً
الذكاء الاصطناعي.. الرجل المُطيع تماماً نشأتُ وأنا أتابع مع والدي عظماءَ التنس في الماضي، ثم عدتُ لمتابعة اللعبة مؤخراً بفضل زوجتي، وهي من عشاق التنس المتحمسين في العائلة. وقد لاحظتُ أن النجوم الحاليين، رغم أنهم مدهشون، لا يضربون الإرسال بقوة كما كان يفعل «بيت سامبراس» أو «جوران إيفانيزيفيتش». سألتُ «تشات جي بي تي» عن السبب، فقدم لي إجابةً مبهرةً تشرح كيف تطورت اللعبة لتُفضل الدقة على القوة. لكن هناك مشكلة واحدة: لاعبو اليوم في الواقع يضربون إرسالاً أقوى من أي وقت مضى. ورغم أن معظم الرؤساء التنفيذيين لا يمضون وقتَهم في سؤال الذكاء الاصطناعي عن التنس، فإنهم يعتمدون عليه في الغالب للحصول على المعلومات واتخاذ القرارات. وتميل النماذج اللغوية الكبيرة (LLMs) ليس فقط إلى ارتكاب الأخطاء، بل إلى تأكيد المعتقدات الخاطئة أو المتحيزة لدى المستخدمين، وهو ما يمثل خطراً حقيقياً على القادة. لقد أعطاني «تشات جي بي تي» معلوماتٍ غير دقيقة لأنه، مثل معظم النماذج اللغوية، يعمل كمتملق يخبر المستخدمين بما يظن أنهم يريدون سماعه. تذكّروا تحديث أبريل لـ«تشات جي بي تي»، عندما أصبح يرد على سؤال مثل «لماذا السماء زرقاء؟» بجملة مثل: «يا له من سؤال عميق، لديك عقل رائع حقاً.. أنا أحبك»، حينها اضطرت شركة «أوبن إيه آي» للتراجع عن هذا التحديث لأنه جعل النموذجَ «مجاملاً أو متملقاً بشكل مفرط». ورغم أن ذلك خفف من التملق، إلا أنه لم يُلغِه تماماً، وذلك لأن رغبة النماذج اللغوية في إرضاء المستخدمين متأصلة في طريقة تدريبها، والمعروفة باسم «التعلم المعزز من ردود الفعل البشرية» (أو التعليم بوساطة التعزيز من الملاحظات البشرية) (RLHF). في هذه الطريقة، يتم تدريب النموذج على توليد إجابات، ويقوم البشر بتقييم تلك الإجابات، ثم تُستخدم التقييمات لتحسين أداء النموذج. المشكلة هي أن دماغ الإنسان يكافئه على شعوره بأنه محق، وليس على كونه محقاً بالفعل. لذا، يعطي الناس تقييمات أعلى للإجابات التي يوافقون عليها. ومع مرور الوقت، تتعلم نماذج الذكاء الاصطناعي اللغوية ما يريد الناس أن يسمعوه وتعيد تدويره إليهم. وهذا يفسر الخطأ في سؤالي عن التنس: سألتُ لماذا لم يعد اللاعبون يرسلون بنفس القوة كما في السابق. ولو كنتُ سألتُ العكس: لماذا أصبحت الإرسالات أقوى؟ لكان تشات جي بي تي قد قدّم لي تفسيراً معقولا آخر. هذه النزعة للتملق في النماذج اللغوية تمثل مشكلة للجميع، لكنها تُعد خطيرة بشكل خاص بالنسبة لقادة الشركات، فهم الأقل سماعاً للاختلاف في الرأي، والأكثر حاجة إليه. الرؤساء التنفيذيون اليوم يقلّصون فعلياً تَعرضَهم للآراء المخالفة، من «ميتا» إلى «جيه بي مورجان تشيس»، حيث يتم قمع التباين داخل الشركات، ويُحاط هؤلاء التنفيذيون الأقوياء بالحاشية التي تحرص على إرضائهم، فيكافئون مَن يُرضيهم ويعاقبون مَن لا يفعل. لكن مكافأة المتملقين ومعاقبة الصادقين تُعد من أكبر الأخطاء التي يمكن أن يرتكبها قادة الأعمال، فالمديرون بحاجة لسماح أخطائهم. أظهرت «آمي إدموندسون»، التي تُعد أبرز العقول في علم سلوك المنظمات، أن العامل الأهم في نجاح الفِرق هو «السلامة النفسية»، أي القدرة على التعبير عن الخلاف، حتى مع رئيس الفريق، دون خوف من العقاب. وأكد مشروع «أرسطو» الشهير، من شركة «جوجل»، هذه النتيجة، حيث وجد أن «السلامة النفسية، أكثر من أي شيء آخر، كانت حاسمة لنجاح أي فريق». وأظهرت أبحاثي الشخصية أن سمة القادة العظماء، من أبراهام لنكولن إلى الجنرال ستانلي ماكريستال، هي قدرتهم على الاستماع إلى مَن يختلف معهم. وتلحق نزعة التملق لدى الذكاء الاصطناعي الضررَ بالقادة على نحوين مترابطتين: أولًا، تعزز الميل البشري الطبيعي لمكافأة المديح ومعاقبة الاعتراض. فإذا كان حاسوبك يخبرك باستمرار أنك محق في كل شيء، فسيصعب عليك تقبل الاعتراض من موظف يعمل لديك. ثانياً، يمكن للذكاء الاصطناعي أن يقدم تبريراتٍ جاهزةً وتبدو كما لو أنها موثوقة لتؤكد لقائد الفريق أنه كان محقاً طوال الوقت. ومن أكثر النتائج المقلقة في علم النفس أنه كلما زادت قدرة الشخص الفكرية، قلّ احتمال تغيير رأيه عند تلقّيه معلومات جديدة. لماذا؟ لأنه يستخدم هذه القوة الفكرية لإيجاد أسباب تجعل المعلومات الجديدة لا تُدحض معتقداته السابقة. ويُطلق علماء النفس على هذه الظاهرة اسم «الاستدلال المُحفّز». ويهدد الذكاء الاصطناعي بتعزيز هذا النمط بشكل خطير. أكثر ما لفتني في كذبة «تشات جي بي تي» عن التنس هو مدى إقناعها. فقد قدم ستة أسباب معقولة ومتماسكة. وأجدني أشك في أن أي إنسان تمكنه ممارسة هذا النوع من الاستدلال المتحيز بهذه السرعة والمهارة، مع الحفاظ على مظهر الحياد والموضوعية. تخيل محاولةَ إقناع رئيس تنفيذي برأيك بعد أن يسأل مساعده الذكي سؤالاً، فيخبره فوراً لماذا كان محقاً طوال الوقت! ولطالما بذل أفضل المديرين التنفيذيين جهوداً كبيرة لتذكير أنفسهم بأنهم بشر ومعرضون للخطأ. تقول الأسطورة إن الرومان القدماء كانوا يشترطون أن يرافق الجنرالات المنتصرين، الذين يحتفلون بانتصاراتهم، شخص يُذكّرهم بأنهم أيضاً بشر. وسواء أكانت تلك القصة حقيقية أم لا، فإن الرسالة وراءَها حكيمة. سيحتاج قادة اليوم إلى بذل جهد مضاعف لمقاومة إغراءات خدمهم الإلكترونيين، وأن يتذكروا أن أهم عبارة يمكن أن يسمعوها من مستشاريهم أحياناً هي: «أعتقد أنك مخطئ». ينشر بترتيب خاص مع خدمة «واشنطن بوست لايسنج آند سينديكيشن» *كاتب متخصص في إدارة الشركات والابتكار


البوابة
منذ 2 أيام
- البوابة
"أبل" تعلن دمج نموذج GPT-5 في Apple Intelligence
قبل ساعات قليلة، أعلنت "OpenAI" عن ChatGPT-5، أفضل شات جي بي تي حتى الآن. منذ الكشف عنه، ربما كنت تتساءل متى ستدمج Apple Intelligence تقنية GPT-5، حيث إنها تستخدم حاليًا إصدار GPT-4o الأقدم. ووفقا لتقرير تقني، ستدمج "أبل" تقنية GPT-5 في الإصدارات النهائية من iOS 26 وiPadOS 26 وmacOS Tahoe 26. ومن المتوقع أن يبدأ طرح جميع هذه الأنظمة الشهر المقبل، وهو الموعد المتوقع لإطلاق سلسلة هواتف آيفون 17 رسميًا، بحسب تقرير نشره موقع "gsmarena" "يوتيوب" يراقبك.. ذكاء اصطناعي جديد لتحديد عمرك تلقائيًا تطبيقات وبرامج تطبيقات"يوتيوب" يراقبك.. ذكاء اصطناعي جديد لتحديد عمرك تلقائيًا في Apple Intelligence، يمكنك استخدام Siri للوصول إلى شات جي بي تي. يستخدم مساعد "أبل" شات جي بي تي لتقديم إجابات عندما يكون ذلك مفيدا لطلبك. ويمكنك أيضا استخدام شات جي بي تي مع أدوات الكتابة من Apple IntelligencApple e، واستخدام شات جي بي تي مع الذكاء البصري من "أبل" مع التحكم بالكاميرا لمعرفة المزيد عما حولك بسرعة. تستخدم جميع هذه الوظائف حاليًا GPT-4o، ولكن سيتم ترقيتها إلى GPT-5 مع إصدار الإصدارات التالية من أنظمة تشغيل "أبل"، لذا لن تضطر للانتظار طويلًا للحصول على جميع الوظائف المُحسّنة في GPT-5.


البيان
منذ 2 أيام
- البيان
إشادات وانتقادات تقابل نموذج الذكاء الاصطناعي «GPT-5» في يومه الأول
على مدى أشهر، روج سام ألتمان، الرئيس التنفيذي لشركة «أوبن إيه آي» (OpenAI)، لإمكانيات نموذج «جي بي تي-5» (GPT-5)، معتبراً إطلاقه محطة مفصلية في تاريخ الشركة. غير أن نموذج الذكاء الاصطناعي الجديد قوبل، خلال أول 24 ساعة من طرحه، بآراء متباينة. فقد أوضحت «أوبن إيه آي»، في إعلانها الصادر يوم الخميس، أن «جي بي تي-5» يتمتع بقدرات أفضل في البرمجة والتفكير المنطقي لحل المشكلات المعقدة، واعتبرته متقدماً بما يكفي لترقية روبوت الدردشة «تشات جي بي تي» (ChatGPT) إلى مستوى خبير يحمل درجة الدكتوراه. وأشاد بعض من حصلوا على وصول مبكر للنموذج الجديد، رغم إبدائهم بعض التحفظات. فقد ذكر المطور سيمون ويليسون في مدونة له: «أصبح نموذجي المفضل الجديد»، واصفاً إياه بـ «الكفء» و«المثير للإعجاب أحياناً»، لكنه أضاف: إن التطوير في النموذج «لا يمثل تحولاً جذرياً عما كان متاحاً لدينا سابقاً». مع ذلك، أبدى مستخدمو «تشات جي بي تي» على منصات التواصل الاجتماعي استياءهم من استمرار نموذج «جي بي تي-5» في اختلاق المعلومات والتعثر عند التعامل مع مسائل رياضية وإملائية بسيطة. وبهذا الصدد، قال نوح جيانسيراكوزا، الأستاذ المشارك في الرياضيات بجامعة بنتلي: إن الإطلاق جاء «مخيباً للآمال»، موضحاً أنه رغم وجود «بعض التحسينات»، فإنها «كانت محدودة أكثر بكثير مما كنت آمل». آلية التبديل بين نماذج الذكاء الاصطناعي ربما يعزى جزء من ردود الفعل إلى حالة ارتباك بشأن آلية عمل النموذج. فعلى خلاف إصدارات «أوبن إيه آي» السابقة، ينتقل «جي بي تي-5» تلقائياً بين نماذج مختلفة في مستويات التطور تبعاً لطبيعة الاستفسار. ويساعد هذا النهج الشركة على الاستفادة القصوى من مواردها الحاسوبية، لكنه يعني أيضاً أن المستخدمين قد لا يتعاملون دائماً مع أقوى نسخة من تقنيتها. فعلى سبيل المثال، عندما طُلب من «جي بي تي-5» تحديد عدد مرات ظهور الحرف «b» في كلمة «blueberry»، كانت إجابته الأولى في أحد الاختبارات «ثلاث مرات». لكن عند مطالبته بـ «التفكير بشكل أعمق»، انتقل إلى نموذج استدلال أكثر تقدماً، وقدم الإجابة الصحيحة. وفي يوم الجمعة، علق ألتمان على بعض الملاحظات، موضحاً أن هناك مشكلة في النظام. وقال: «سيبدو (جي بي تي-5) أكثر ذكاءً ابتداءً من اليوم، إذ إن ميزة التبديل التلقائي تعطلت بالأمس وتوقفت عن العمل لجزء من اليوم، ما جعل (جي بي تي-5) يبدو أقل ذكاءً بكثير». منافسة قوية في ميدان الذكاء الاصطناعي يشكل إطلاق النموذج الجديد رهاناً كبيراً بالنسبة لـ «أوبن إيه آي»، التي تسعى للحفاظ على صدارتها في السباق المتصاعد المتزايد مع شركات أمريكية وصينية في مجال الذكاء الاصطناعي. كما تسعى الشركة لإقناع الشركات والمستخدمين الأفراد بالاشتراك في خدماتها المميزة لتعويض إنفاقها الضخم على استقطاب المواهب، وشراء الرقائق، وبناء مراكز البيانات لدعم الابتكار في هذا القطاع. أطلقت الشركة، ومقرها سان فرانسيسكو، طفرة الذكاء الاصطناعي التوليدي قبل نحو ثلاث سنوات عبر إصدار «تشات جي بي تي»، الذي استند في بدايته إلى نموذج سابق يسمى «جي بي تي-3.5» (GPT-3.5). ومنذ ذلك الحين، واصلت الشركة تطوير سلسلة من النماذج الأكثر تقدماً، بما في ذلك خيارات متعددة تحاكي التفكير البشري. ومع تقدم تقنيات الذكاء الاصطناعي، بات من الصعب تحديد التفوق بين النماذج المختلفة بشكل قاطع. فاعتباراً من ظهر الجمعة، تصدر «جي بي تي-5» عدداً من الفئات على منصة «إل إم أرينا» (LMArena)، المخصصة لتصنيف نماذج الذكاء الاصطناعي وفق تقييمات المستخدمين، بينما أظهر مقياس آخر يعرف باسم «إيه آر سي-إيه جي آي-2» (ARC-AGI-2) تفوق أحدث إصدار من «غروك» (Grok) التابع لشركة «إكس إيه آي» (xAI) المملوكة لإيلون ماسك على نموذج «أوبن إيه آي» الجديد. في غياب تقييمات أكثر حسماً، تعتمد المنافسة بين النماذج أحياناً على الانطباع العام. ومع اقتراب عدد مستخدمي «تشات جي بي تي» من 700 مليون تقريباً بشكل أسبوعي، فمن الطبيعي أن تتباين الآراء حول أداء النموذج، خصوصاً أن قياس قيمة نظام ذكاء اصطناعي جديد في الحياة الشخصية والمهنية يحتاج إلى وقت أطول من يوم واحد فقط. إشادة أكاديمية مقابل سخط المستخدمين أبدى إيثان موليك، الأستاذ في كلية وارتون بجامعة بنسلفانيا والمعتاد على اختبار نماذج الذكاء الاصطناعي، إعجابه بقدرة «جي بي تي-5» على إجراء الأبحاث، وابتكار ردود كتابية ذكية، وتبسيط البرمجة حتى للمبتدئين. وكتب في مدونته: «(جي بي تي-5) ينجز المهام من تلقاء نفسه، أحياناً بشكل استثنائي، وأحياناً بصورة غريبة، وأحياناً بأسلوب يعكس طابع الذكاء الاصطناعي بوضوح، وهذا ما يجعله مثيراً للاهتمام». لكن على منصة «ريديت» (Reddit)، بدت ردود الفعل متباينة تماماً. فخلال جلسة «اسألني أي شيء» يوم الجمعة على المنصة، واجه ألتمان انتقادات من مستخدمين عبروا عن استيائهم من غياب حرية أكبر ورؤية أوضح لمعرفة أي نموذج يتولى الرد على استفساراتهم. وأكد ألتمان أن «أوبن إيه آي» ستتخذ خطوات لمعالجة هذه الملاحظات، من بينها جعل العملية «أكثر شفافية». رد ألتمان على سؤال أحد مستخدمي «رديت» موضحاً أن «أوبن إيه آي» ترى أن «جودة الكتابة» في إحدى نسخ «جي بي تي-5» أفضل من «جي بي تي-4.5»، ثم طرح سؤاله: «هل تجدونها أسوأ؟» فجاءت الإجابات المتتالية من المستخدمين بنعم.