
نماذج OpenAI الجديدة تصدم الخبراء بمعدلات هلوسة غير مسبوقة
أطلقت شركة OpenAI مؤخرًا نماذجها الجديدة المسماة o3 وo4-mini، ضمن ما يعرف بنماذج الاستدلال، والتي وُصفت بأنها تمثل تطورًا كبيرًا في قدراتها الحسابية، خصوصًا في مجالات البرمجة والرياضيات. لكن المفارقة أن هذه النماذج تعاني من مشكلة قديمة تتفاقم: الهلوسة.
الهلوسة في الذكاء الاصطناعي تعني أن يُنتج النموذج معلومات خاطئة تبدو مقنعة، وقد كانت مشكلة مستمرة في جميع النماذج السابقة، إلا أن المقلق في النماذج الجديدة أنها تُظهر معدلات أعلى من الهلوسة مقارنة بنماذج OpenAI الأقدم مثل o1 وGPT-4o.
في اختبارات داخلية، تبين أن نموذج o3 يهلوس في نحو 33% من إجابات اختبار PersonQA، وهو معيار داخلي لقياس دقة النموذج في المعلومات المتعلقة بالأشخاص، وهي نسبة تقارب ضعف ما سجله o1 وo3-mini. أما o4-mini فكانت نتائجه أسوأ، حيث بلغت نسبة الهلوسة 48%.
ولعل الأمر الأكثر إثارة للقلق هو أن OpenAI نفسها لا تعرف حتى الآن السبب الدقيق لزيادة هذه المشكلة، وصرحت في تقاريرها بأن الأمر يحتاج إلى مزيد من البحث لفهم العلاقة بين توسيع نطاق النماذج وزيادة معدلات الهلوسة، وفقا لـ "تك كرانش"
مؤسسة الأبحاث Transluce لاحظت أيضًا أن نموذج o3 لا يكتفي بالمعلومات الخاطئة، بل قد "يختلق سيناريوهات"، كادعائه تشغيل كود برمجي على جهاز MacBook Pro رغم عدم امتلاكه القدرة على ذلك، مما يثير تساؤلات حول حدود مصداقية النموذج.
ورغم هذه المشكلات، فإن بعض الخبراء، مثل كيان كاتانفوروش من جامعة ستانفورد، يرون أن الأداء البرمجي العالي لـ o3 يجعله منافسًا قويًا، لكنه لا يزال يقع في أخطاء مثل تقديم روابط وهمية أو غير فعالة.
وفي ظل تزايد اعتماد الشركات على نماذج الذكاء الاصطناعي، تصبح دقة المخرجات أمرًا أساسيًا لا يمكن التهاون فيه، خاصة في مجالات حساسة مثل القانون أو الطب. من هنا، يُطرح أحد الحلول المحتملة: دمج النماذج مع إمكانيات البحث الحي عبر الإنترنت، كما هو الحال في نموذج GPT-4o، الذي أظهر دقة بلغت 90% في اختبار SimpleQA.
في النهاية، يبقى الاستدلال أداة واعدة، لكنه يحمل في طياته تحديات حقيقية، وعلى رأسها الهلوسة. ويبدو أن OpenAI، ومعها المجتمع البحثي، أمام مفترق طرق: إما السيطرة على هذه الظاهرة، أو مواجهة تباطؤ في اعتماد هذه النماذج في تطبيقات الحياة الواقعية.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


البوابة العربية للأخبار التقنية
منذ يوم واحد
- البوابة العربية للأخبار التقنية
تقرير.. الكشف عن ملامح أول جهاز لـ OpenAI
كشفت صحيفة وول ستريت جورنال أن أول جهاز تعمل عليه OpenAI بالتعاون مع مصمم آبل السابق جوني آيف لن يكون هاتفًا ذكيًا ولا جهازًا قابلًا للارتداء، بل قد لا يحتوي حتى على شاشة، مما يشير إلى توجه مبتكر وغير تقليدي في فئة الأجهزة الذكية. ويأتي ذلك بعد إعلان شركة OpenAI استحواذها على شركة io الناشئة التي أسسها آيف، في صفقة تُقدّر قيمتها بـ 6.5 مليارات دولار. ووفقًا للتقرير، فقد أبلغ الرئيس التنفيذي سام ألتمان موظفي الشركة بأن لديهم الآن 'فرصة لإنجاز أعظم مشروع في تاريخ OpenAI'. وأشار كل من آيف وألتمان إلى بعض ملامح الجهاز الجديد، إذ أوضحا أنه سيكون واعيًا تمامًا بمحيطه وبنشاطات المستخدم، كما سيتميز بتصميم غير مزعج يمكن وضعه في الجيب أو على المكتب، ومن المتوقع أن يتحوّل إلى أحد الأجهزة الأساسية للمستخدمين بعد الحاسوب والهاتف. وبحسب التقرير، فإن الجهاز لن يكون هاتفًا أو نظارة ذكية، وهو ما يعكس رغبة الفريق في تقليل الاعتماد على الشاشات، إذ يطمح آيف وألتمان إلى 'فطام المستخدمين' عن الأجهزة التقليدية القائمة على العرض البصري. وتعتزم الشركة الحفاظ على سرية تصميم الجهاز ومواصفاته حتى لحظة الإطلاق، تفاديًا لمحاولات التقليد من المنافسين. وتخطط الشركة لإطلاق الجهاز الجديد في أواخر عام 2026 مع هدف طموح، وهو شحن 100 مليون وحدة بأسرع وتيرة في تاريخ صناعة الأجهزة الذكية. ووفقًا للتقرير، فقد بدأ فريق آيف منذ أربعة أشهر بالتفاوض مع موردين قادرين على تصنيع الجهاز على نطاق واسع، وذلك بعد تعاون دام أكثر من عام ونصف مع OpenAI، إذ كان الهدف الأولي تطوير منتج يعتمد على تقنيات الذكاء الاصطناعي التوليدي من OpenAI، قبل أن تقرر الأخيرة الاستحواذ الكامل على الشركة. وتبقى الأسئلة معلقة حول طبيعة هذا الجهاز الجديد، ومدى قدرة التصميم المبتكر والتقنية المتقدمة على إقناع المستخدمين باقتناء فئة جديدة بالكامل من الأجهزة، خاصةً بعد إخفاق محاولات مشابهة مثل جهاز Ai Pin من شركة Humane، الذي توقفت خدماته نهائيًا مطلع العام الجاري.


البوابة العربية للأخبار التقنية
منذ يوم واحد
- البوابة العربية للأخبار التقنية
OpenAI تستحوذ على شركة 'io' لتصميم الأجهزة الذكية
أعلنت شركة OpenAI استحواذها على شركة io الناشئة والمتخصصة في تطوير العتاد الذكي، وهي الشركة التي أسّسها مصمم آبل الشهير جوني آيف إلى جانب عدد من المهندسين البارزين الذين عملوا سابقًا معه في آبل، منهم سكوت كانون، وإيفانز هانكي، وتانغ تان. ووفقًا لتقرير نشرته وكالة بلومبرج، فإن قيمة الصفقة تُقدّر بنحو 6.5 مليارات دولار، وتشمل انتقال نحو 55 من مهندسي العتاد والمطورين والخبراء في التصنيع إلى صفوف OpenAI، ومنهم الأسماء الثلاثة البارزة المشاركة في التأسيس. ومع أن جوني آيف لن ينضم رسميًا إلى OpenAI، فإن شركته التصميمية LoveFrom ستتولى مهام التصميم لكافة منتجات OpenAI المستقبلية والبرمجيات الخاصة بها، مع الحفاظ على استقلاليتها. ومن المتوقع إطلاق أولى الأجهزة الناتجة عن هذا التعاون الجديد في عام 2026. وقد أشار آيف في مقابلة مع وكالة بلومبرغ إلى أن معظم الأجهزة المدعومة بالذكاء الاصطناعي التي طُرحت حديثًا مثل Humane Pin و Rabbit R1 كانت 'منتجات سيئة للغاية'، مضيفًا أن 'المنتجات الحالية تفتقر إلى أفكار جديدة وجريئة'. وأكد الرئيس التنفيذي لـOpenAI، سام ألتمان، أن أول منتج يعمل عليه الفريق 'ليس بديلًا للهاتف الذكي'، موضحًا أنه: 'كما أن الهواتف لم تلغِ وجود الحواسيب المحمولة، فإن المنتج الجديد لن يلغي الهاتف، بل يشكّل فئة مختلفة بالكامل'. ووصف آيف هذا المنتج بأنه 'جهاز استحوذ بالكامل على خيال الفريق'، في حين قال ألتمان: 'لقد سلّمني جوني حديثًا أحد النماذج الأولية، وقد عشت معه لبعض الوقت، وأعتقد أنه من أروع ما أنتجته التكنولوجيا حتى الآن'. وفي منشور مشترك، قال آيف وألتمان: 'لقد جمعنا أفضل المهندسين في العتاد والبرمجيات، وأمهر العلماء والخبراء في تطوير المنتجات وتصنيعها. لقد عمل الكثير منا معًا لعقود من الزمن. وسيتم إدماج فريق io في OpenAI للعمل من قرب مع فرق البحث والهندسة في سان فرانسيسكو'. وأضاف ألتمان قائلًا: 'إن الذكاء الاصطناعي تقنية مذهلة، لكن الأدوات العظيمة تحتاج إلى تصميم يقوم على فهم عميق للتكنولوجيا والناس والعالم. ولا أحد يُجيد هذا المزيج كما يجيده جوني وفريقه، فهم يهتمون بأدق التفاصيل'. وأما آيف، فقد أعرب عن امتنانه لهذه الفرصة، قائلًا: 'إنني أشعر أن كل ما تعلمته على مدار الثلاثين عامًا الماضية قد قادني إلى هذه اللحظة. إن المسؤولية جسيمة، لكنني متحمّس وممتن لهذه الشراكة الملهمة'.

سكاي نيوز عربية
منذ يوم واحد
- سكاي نيوز عربية
تغيير مفهوم البحث.. من الروابط إلى المحادثات الذكية
في هذا السياق، تعد التحديثات التقنية جزء من "إعادة تصور شاملة لعالم البحث"، كما وصفها قادة الصناعة. ومن هنا صارت المنافسة تدور حول من يملك أكبر قاعدة بيانات أو أسرع خوارزمية، ومن ينجح في تحويل محرك البحث إلى شريك ذكي يفهم السياق ويدرك القصد، ويقدّم حلولًا تتجاوز النصوص إلى الفهم. تُجدد شركة غوغل محرك البحث الخاص بها لإضافة ميزات تسمح له بالعمل بشكل مشابه لروبوت الدردشة بالذكاء الاصطناعي، حيث تتنافس الشركة مع منافسين مثل OpenAI. ابتداءً من يوم الثلاثاء، تم تفعيل "وضع الذكاء الاصطناعي" في بحث غوغل ومتصفح كروم ، والذي سيوفر تجربة محادثة وأسئلة وأجوبة تشبه ChatGPT من OpenAI ، بدلاً من قائمة تقليدية من الروابط. الرئيس التنفيذي لشركة ألفابت ، الشركة الأم لغوغل، سوندار بيتشاي، وصف هذه الخطوة بأنها "إعادة تصور شاملة لعالم البحث"، وذلك خلال مؤتمرها السنوي للمطورين في ماونتن فيو هذا الأسبوع. يمثل هذا الإصدار أحدث الجهود المبذولة لدمج الذكاء الاصطناعي المُولِّد في محرك البحث المهيمن لغوغل، حتى مع قلق المستثمرين من أن المنتجات الجديدة ستُهدر موارده المالية، بحسب تقرير لصحيفة "فايننشال تايمز" البريطانية. كان بيتشاي قد تعرّض لانتقادات بسبب بطء وتيرة إصدارات الذكاء الاصطناعي ، بعد أن كانت غوغل رائدة الصناعة في تطوير الأبحاث التي أدت إلى طفرة الذكاء الاصطناعي التوليدي. وقد سمح ذلك لشركات ناشئة مثل OpenAI وAnthropic بالنمو لتصبح شركات بمليارات الدولارات، وبدأت تتحدى احتكار غوغل للاستعلامات عبر الإنترنت. استجابةً لذلك، اضطرت غوغل إلى تسريع جدول إطلاقها وإجراء تحسينات سريعة على نموذجها اللغوي الكبير جيميني. وتزعم أن الإصدار 2.5 الأحدث يتفوق على ChatGPT من OpenAI وClude من Anthropic في العديد من اختبارات الأداء، وخاصةً في البرمجة. قال بيتشاي إن غوغل لا تزال تتمتع بميزة توزيعية هائلة على منافسيها، إذ تُجري 8.5 مليار استفسار يوميًا. وأضاف: "يُتيح البحث الذكاء الاصطناعي لعدد أكبر من الناس مقارنةً بأي منتج آخر في العالم". في حديثه مع "اقتصاد سكاي نيوز عربية"، يشير المستشار الأكاديمي في جامعة سان خوسيه الحكومية في كاليفورنيا، أحمد بانافع، إلى أن تأثير خطوة غوغل الأخيرة على سباق الذكاء الاصطناعي ، مُبرزاً عدداً من محاور التأثير الرئيسية على النحو التالي: تسريع وتيرة الابتكار: بدمج غوغل للذكاء الاصطناعي التخاطبي في محرك بحثها، تزداد المنافسة مع لاعبين مثل OpenAI التي طورت ChatGPT ، ومايكروسوفت التي دمجت ChatGPT في Bing. هذه المنافسة تدفع الجميع إلى تسريع وتيرة البحث والتطوير لتقديم نماذج ذكاء اصطناعي أكثر قوة ودقة وقدرة على فهم اللغة البشرية وإنشاء محتوى ذي صلة. تركيز على التطبيقات العملية: بدلًا من مجرد تطوير نماذج نظرية، تضغط هذه الخطوة على الشركات لتركيز جهودها على دمج الذكاء الاصطناعي في منتجاتها الأساسية، مما يعني تسريع ظهور تطبيقات عملية ومفيدة للمستخدمين. تغيير تعريف "البحث".. من الروابط إلى الإجابات المباشرة: يتجه البحث من مجرد تقديم قائمة بالروابط إلى تقديم إجابات مباشرة ومُلخصة، مدعومة بمصادر متعددة. هذا يغير طريقة تفاعل المستخدمين مع المعلومات، ويجعل البحث أكثر تفاعلية و"محادثية". التركيز على فهم السياق والقصد: ستتطلب محركات البحث المدعومة بالذكاء الاصطناعي فهمًا أعمق لسياق استفسارات المستخدمين وقصدهم، وليس فقط الكلمات المفتاحية. هذا سيدفع حدود تطور معالجة اللغة الطبيعية . أما لجهة تأثير تلك الخطوة على نماذج الأعمال، يتحدث بانافع عن الإعلانات بشكل خاص، ذلك أنه "قد يؤثر تقديم إجابات مباشرة من الذكاء الاصطناعي على نموذج الإعلانات التقليدي لمحركات البحث، حيث قد لا يضطر المستخدمون إلى النقر على الروابط بنفس القدر، وهذا يدفع غوغل وغيرها للبحث عن طرق جديدة لدمج الإعلانات بشكل طبيعي وغير مزعج ضمن تجربة البحث القائمة على الذكاء الاصطناعي". أما لجهة نمو سوق الذكاء الاصطناعي للمحادثات، فمن المتوقع أن تنمو سوق الذكاء الاصطناعي للمحادثات بشكل كبير، حيث تتبنى الشركات هذه التقنيات لخدمة العملاء، والتسويق، وتحليل البيانات. وكان المسؤولون التنفيذيون متحفظين بشأن كيفية تخطيطهم لدمج الإعلانات في عروض البحث الجديدة القائمة على الذكاء الاصطناعي والمتصفحات والتطبيقات. حققت غوغل 50 مليار دولار من إيرادات إعلانات البحث في الربع الأول ، أي أكثر من نصف إجمالي إيرادات ألفابت البالغة 90 مليار دولار. نهج شامل ويشير تقرير لصحيفة الغارديان البريطانية إلى مثال آخر على نهج غوغل الشامل في مجال الذكاء الاصطناعي، إذ كشفت الشركة عن خططها لإعادة دخول سوق النظارات الذكية بنظارة جديدة تعمل بنظام أندرويد XR. تأتي المعاينة الأولية للجهاز القادم، الذي يتضمن كاميرا تعمل بدون استخدام اليدين ومساعدًا صوتيًا للذكاء الاصطناعي، بعد 13 عامًا من إطلاق نظارة غوغل جلاس ، وهي منتج ألغت الشركة طرحه بعد ردود فعل غاضبة من الجمهور بسبب مخاوف تتعلق بالخصوصية. لم تُعلن غوغل عن موعد طرح نظارات أندرويد XR أو سعرها، لكنها كشفت أنها ستُصمم بالتعاون مع شركتي جنتل مونستر وواربي باركر. وستُنافس هذه النظارات منتجًا مشابهًا متوفرًا بالفعل في السوق من شركتي ميتا بلاتفورمز، الشركة الأم لفيسبوك، وراي بان. وبحسب التقرير، يعتمد التوسع على التحول الذي بدأته غوغل قبل عام مع تقديم ملخصات المحادثة التي تسمى "نظرة عامة على الذكاء الاصطناعي" والتي تظهر بشكل متزايد في الجزء العلوي من صفحة نتائجها وتتفوق على تصنيفاتها التقليدية لروابط الويب. وفقاً لغوغل، يتفاعل الآن حوالي 1.5 مليار شخص بشكل منتظم مع "نظرة عامة على الذكاء الاصطناعي"، ويقوم معظم المستخدمين الآن بإدخال استعلامات أطول وأكثر تعقيدًا. من جانبه، يقول استشاري العلوم الإدارية وتكنولوجيا المعلومات في G&K، عاصم جلال، لموقع "اقتصاد سكاي نيوز عربية": "خطوة غوغل الأخيرة تُعد تطورًا مهمًا للغاية في ظل التحولات الكبيرة التي نشهدها في طريقة استخدام الناس لمحركات البحث". الكثير من المستخدمين بدأوا بالفعل يعتمدون على روبوتات الذكاء الاصطناعي مثل ChatGPT وBard وGrok التابعة لشركات مثل OpenAI وGoogle وxAI، كبدائل للحصول على المعلومات. هذا التوجه يمثل تهديدًا واضحًا لغوغل، لأن نموذجها الأساسي للإيرادات يعتمد بشكل كبير على الإعلانات المرتبطة بعمليات البحث، خاصة وأن متصفح كروم ونظام أندرويد يُقدمان مجانًا، ما يجعل الإعلانات هي المصدر الرئيسي للتمويل. إذا استمرت هذه الظاهرة وبدأ المستخدمون في استبدال البحث التقليدي بالمحادثات مع روبوتات الذكاء الاصطناعي، سيكون لذلك أثر كبير على غوغل. وهنا برز التساؤل: كيف ستتعامل غوغل مع هذا التغيير؟ وهل ستستمر في الاعتماد على الإعلانات؟ وإذا نعم، فكيف سيكون شكل الإعلان في سيناريو يُجري فيه المستخدم محادثة مع ذكاء اصطناعي بدلًا من تصفح نتائج بحث تقليدية؟ ويضيف: في المقابل، نماذج الأعمال الخاصة بالشركات الأخرى مثل OpenAI تعتمد على الاشتراكات، وحتى إن لم تكن هذه الاشتراكات تُغطي التكاليف بشكل كامل حتى الآن، إلا أنها تستند إلى استراتيجية معروفة وهي جذب المستثمرين من خلال إظهار القدرة المستقبلية على تحقيق أرباح ضخمة بفضل الحصة السوقية الكبيرة التي يتم اكتسابها الآن. هذا الأسلوب اتبعته شركات كبرى من قبل مثل فيسبوك، حيث ركزت في البداية على التوسع وانتشار الخدمة، ثم بدأت بتحقيق الأرباح. أما غوغل، فهي تمتلك بالفعل الحصة السوقية والدخل، وبالتالي لا يمكنها التضحية بمصدر دخلها الرئيسي بسهولة، وهي الآن تواجه تحديًا حقيقيًا في كيفية التكيف مع هذا التحول في سلوك المستخدمين دون أن تخسر مكانتها المالية."