نماذج OpenAI بهلوسة غير مسبوقة
الهلوسة في الذكاء الاصطناعي تعني أن يُنتج النموذج معلومات خاطئة تبدو مقنعة، وقد كانت مشكلة مستمرة في جميع النماذج السابقة، إلا أن المقلق في النماذج الجديدة أنها تُظهر معدلات أعلى من الهلوسة مقارنة بنماذج OpenAI الأقدم مثل o1 وGPT-4o.
في اختبارات داخلية، تبين أن نموذج o3 يهلوس في نحو 33 % من إجابات اختبار PersonQA، وهو معيار داخلي لقياس دقة النموذج في المعلومات المتعلقة بالأشخاص، وهي نسبة تقارب ضعف ما سجله o1 وo3-mini. أما o4-mini فكانت نتائجه أسوأ، حيث بلغت نسبة الهلوسة 48 %.
ولعل الأمر الأكثر إثارة للقلق هو أن OpenAI نفسها لا تعرف حتى الآن السبب الدقيق لزيادة هذه المشكلة، وصرحت في تقاريرها بأن الأمر يحتاج إلى مزيد من البحث لفهم العلاقة بين توسيع نطاق النماذج وزيادة معدلات الهلوسة، وفقًا ل«تك كرانش».
مؤسسة الأبحاث Transluce لاحظت أيضًا أن نموذج o3 لا يكتفي بالمعلومات الخاطئة، بل قد «يختلق سيناريوهات»، كادعائه تشغيل كود برمجي على جهاز MacBook Pro رغم عدم امتلاكه القدرة على ذلك، مما يثير تساؤلات حول حدود مصداقية النموذج.
ورغم هذه المشكلات، فإن بعض الخبراء، مثل كيان كاتانفوروش من جامعة ستانفورد، يرون أن الأداء البرمجي العالي لo3 يجعله منافسًا قويًا، لكنه لا يزال يقع في أخطاء مثل تقديم روابط وهمية أو غير فعالة.
وفي ظل تزايد اعتماد الشركات على نماذج الذكاء الاصطناعي، تصبح دقة المخرجات أمرًا أساسيًا لا يمكن التهاون فيه، خاصة في مجالات حساسة مثل القانون أو الطب. من هنا، يُطرح أحد الحلول المحتملة: دمج النماذج مع إمكانيات البحث الحي عبر الإنترنت، كما هو الحال في نموذج GPT-4o، الذي أظهر دقة بلغت 90 % في اختبار SimpleQA.
في النهاية، يبقى الاستدلال أداة واعدة، لكنه يحمل في طياته تحديات حقيقية، وعلى رأسها الهلوسة. ويبدو أن OpenAI، ومعها المجتمع البحثي، أمام مفترق طرق: إما السيطرة على هذه الظاهرة، أو مواجهة تباطؤ في اعتماد هذه النماذج في تطبيقات الحياة الواقعية.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة

العربية
منذ 8 ساعات
- العربية
التكهنات تتزايد حول الجهاز الذكي المقبل من "OpenAI" ومصمم "أبل" السابق
لا أحد يعلم حقًا طبيعة جهاز الذكاء الاصطناعي الذي يُطوّره جوني آيف، رئيس التصميم السابق في "أبل"، وسام ألتمان ، الرئيس التنفيذي لشركة الذكاء الاصطناعي "OpenAI". لكن بمجرد الكشف عن عملهما سويًا لتطوير جهاز ذكاء اصطناعي حفز موجة من التكهنات حول طبيعة وشكل هذا الجهاز المقبل. وكان ألتمان وآيف اتفقا على التعاون في تطوير جهاز مدعوم بالذكاء الاصطناعي قبل عامين، بحسب بتقرير لصحيفة نيويورك تايمز في سبتمبر الماضي. وتتمثل رؤيتهما في منتج يستخدم الذكاء الاصطناعي ليخلق تجربة حوسبية أقل إزعاجًا اجتماعيًا من الآيفون. ويرغبان في مساعدة المستخدمين على الابتعاد عن الشاشات، ويبدوان حذرين تجاه الأجهزة القابلة للارتداء، وفقًا لتقارير. وتكاثرت الأسئلة عن شكل الجهاز، وطبيعة عمله والوظائف التي سيؤديها وكيفية استخدامه، وهذه بعض أبرز التسريبات والتوقعات للجهاز المقبل. جهاز للجيب والمكتب في مكالمة مسرّبة راجعتها صحيفة وول ستريت جورنال، قال ألتمان لموظفي "OpenAI" إن الجهاز ليس هاتفًا ولا نظارات -وهو الشكل الذي تراهن عليه شركتا ميتا وغوغل بقوة، مشيرًا إلى أن آيف لم يكن متحمسًا لفكرة جهاز يجب أن يكون قابلًا للارتداء. وسيكون جهاز الذكاء الاصطناعي المقبل جزءًا من "عائلة من الأجهزة" بدون شاشات، وجهازًا "ثالثًا أساسيًا" يختلف عن الهاتف والحاسوب المحمولين. وسيتمكن المستخدم من وضع الجهاز المقبل في جيبه وأيضًا على المكتب. ووصف ألتمان النموذج الأولي بأنه واحد من أروع قطع التكنولوجيا على الإطلاق. شبيه بالدبوس الذكي كتب مينغ-تشي كو، وهو محلل متخصص في سلسلة توريد "أبل"، على منصة إكس (تويتر سابقًا)، أن آيف وألتمان قد يعملان على شيء مشابه لـ"الدبوس الذكي" (AI pin) المعتمد على الذكاء الاصطناعي، لكنه سيكون أكبر قليلًا ويرتده المستخدم حول عنقه. وسيكون الجهاز، وفقًا لكو، مزودًا بكاميرات وميكروفونات من أجل الوعي ببيئة المستخدم المحيطة. وتوقع كو أن هذا المنتج، الذي سيتصل بالهواتف الذكية لكنه لن يحتوي على شاشة قد يبدأ إنتاجه في عام 2027. وكان ألتمان مستثمرًا في جهاز "دبوس الذكي" من تطوير شركة "Humane" الناشئة، وكان جهازًا صغيرًا يتم التحكم به عن طريق الصوت يمكن للمستخدمين تثبيته على ملابسهم واستخدامه لإجراء المكالمات الهاتفية، والرسائل النصية، وعمليات البحث. وأُطلق هذا المنتج في عام 2023 لكنه لاقى استقبالًا ضعيفًا، وتم إيقافه قبل أن تبدأ الشركة في تصفية عملياتها في فبراير. جهاز أم "رفيق"؟ كان من بين أغرب التفاصيل التي أوردتها "وول ستريت جورنال" من حديث ألتمان لموظفي "OpenAI" هي أنه وصف الجهاز بأنه "رفيق". ويفتح هذا المجال أمام عدد غير محدد من الخيارات بما في ذلك أن يكون الجهاز المقبل روبوتًا، بحب تقرير لموقع "GIZMODO" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".

العربية
منذ 13 ساعات
- العربية
"أوراكل" تشتري شرائح إنفيديا بـ40 مليار دولار لمركز بيانات لـ"OpenAI"
ستنفق شركة أوراكل حوالي 40 مليار دولار لشراء شرائح إنفيديا عالية الأداء لتشغيل مركز بيانات جديد في الولايات المتحدة لشركة الذكاء الاصطناعي "OpenAI". ويُعد مركز البيانات، الواقع في أبيلين بولاية تكساس، جزءًا من مشروع ستارغيت الأميركي، الذي تقوده كبرى شركات الذكاء الاصطناعي في البلاد، لتعزيز ثقل الولايات المتحدة في صناعة الذكاء الاصطناعي في ظل المنافسة العالمية المحتدمة. وقال عدة أشخاص مطلعين على الأمر، إن شركة أوراكل ستشتري حوالي 400 ألف من شرائح إنفيديا الأقوى من نوع "GB200"، وستقوم بتأجير قدرة الحوسبة الناتجة عنها لشركة "OpenAI"، بحسب ما نقلته رويترز عن تقرير لصحيفة فاينانشال تايمز. ومن المتوقع أن يبدأ مركز البيانات العمل بكامل طاقته بحلول منتصف العام المقبل، وقد وافقت "أوراكل" على تأجير الموقع لمدة 15 عامًا. وقدّم بنك جي بي مورغان الجزء الأكبر من تمويل الدين عبر قرضين بلغ مجموعهما 9.6 مليار دولار، بينما استثمر مالكا الموقع، كروزو وشركة الاستثمار الأميركية بلو آول كابيتال، حوالي 5 مليارات دولار نقدًا، بحسب التقرير. سيساعد مركز البيانات شركة "OpenAI" على تقليل اعتمادها على "مايكروسوفت"، أكبر داعميها، حيث تجاوز طلب الشركة، مطورة روبوت الدردشة الشهير شات جي بي تي، على الطاقة ما تستطيع "مايكروسوفت" توفيره. وبالنسبة لشركة أوراكل، يُمثّل مركز البيانات ومشروع ستارغيت فرصةً لها لتعزيز قدراتها في الحوسبة السحابية ومواكبة رواد السوق في هذا المجال "مايكروسوفت" و"أمازون" و"غوغل". وتشارك "OpenAI" و"أوراكل" و"إنفيديا" أيضًا في مشروع ستارغيت في الشرق الأوسط، حيث سيتم إنشاء مركز بيانات ضخم جديد للذكاء الاصطناعي في الإمارات، ومن المتوقع أن يستخدم أكثر من 100 ألف شريحة من "إنفيديا". وسيبدأ تشغيل المرحلة الأولى من مركز البيانات في الإمارات في عام 2026.


صدى الالكترونية
منذ يوم واحد
- صدى الالكترونية
شاومي ترفع الستان عن أكبر تابلت في تاريخها
أعلنت شركة شاومي، عن جهازها اللوحي الجديد Pad 7 Ultra، الذي يعد الأكبر والأكثر تكلفة ضمن أجهزتها اللوحية حتى الآن. ويأتي تابلت شاومي الجديد Pad 7 Ultra مزودا بنفس معالج XRING O1 المطور داخليا المستخدم في الهاتف الجديد، بالإضافة إلى بطارية ضخمة بسعة 12000 مللي أمبير. ويتميز تابلت شاومي بشاشة كبيرة من نوع OLED بقياس 14 بوصة، تستخدم الشاشة مادة TCL المضيئة M9، وتدعم دقة عرض 3.2K مع نسبة أبعاد 3:2. ويأتي ذلك بالإضافة إلى معدل تحديث 120 هرتز وسطوع عام يصل إلى 900 شمعة وذروة سطوع تصل إلى 1600 شمعة. كما يعمل الجهاز الجديد بمعالج XRING O1 الجديد المصنع بتقنية 3 نانومتر من TSMC، ويعتمد على بنية مكونة من 10 أنوية موزعة في مجموعات (2+4+2+2)، ويصل تردد النواة الأسرع إلى 3.7 جيجاهرتز. ويتمتع الصوت في الجهاز بثمانية مكبرات صوت تعمل بأربعة مضخمات وأربعة ميكروفونات ضمن حجرة صوتية بحجم 16.5 سنتيمتر مكعب. ويتوفر الجهاز بأسعار تبدأ من حوالي 800 دولار، للطراز بسعة 12 جيجابايت رام مع 256 جيجابايت تخزين، أما النسخة الأعلى فمزودة بـ 16 جيجابايت رام و1 تيرابايت تخزين مع شاشة Nano Soft Light وتأتي بسعر 970 دولار.