logo
الهلاوس تضرب openAI.. سلوكيات غريبة واختلاق معلومات للمستخدمين

الهلاوس تضرب openAI.. سلوكيات غريبة واختلاق معلومات للمستخدمين

بلد نيوز٢٧-٠٤-٢٠٢٥

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
الهلاوس تضرب openAI.. سلوكيات غريبة واختلاق معلومات للمستخدمين - بلد نيوز, اليوم الأحد 27 أبريل 2025 01:02 مساءً
تسببت هلاوس نماذج الذكاء الاصطناعي الجديدة من شركة openAl في حالة من الجدل، بعد وقوعها في أخطاء اختلاق معلومات غير موجودة، وبالتالي تضليل المستخدمين.
معدل أخطاء نماذج «تشات جي بي تي» الأولى كان طفيفاً مقارنة بما حدث مع آخر النسخ، رغم أنها كانت أقل كفاءة.
تفاصيل اختبارات الهلاوس في نماذج OpenAI
أظهرت اختبارات جديدة على نماذج OpenAI المتطورة o3 و o4-mini زيادة ملحوظة في معدل الهلاوس، وهي حالات يصنع فيها النموذج معلومات غير صحيحة أو غير واقعية، كما أكدت نتائج الاختبارات أن معدل الهلاوس في هذه النماذج أعلى مقارنة بالنماذج السابقة.
في اختبار PersonQA، الذي يقيس دقة النموذج في معرفة المعلومات حول الأشخاص، سجل نموذج o3 معدل هلاوس بلغ 33%، وهو ضعف معدل الهلاوس الذي سجلته نماذج o1 و o3-mini (16% و 14.8% على التوالي، أما نموذج o4-mini فقد سجل أسوأ أداء، حيث وصل معدل الهلاوس إلى 48%.
كما أظهرت الاختبارات أن o3 قد يختلق معلومات حول الإجراءات التي اتخذها للوصول إلى إجابات، وأشار الباحثون إلى أن السبب وراء هذه الهلاوس قد يكون تقنيات التعلم المعزز المستخدمة في تدريب نماذج o-series، والتي قد تؤدي إلى تفاقم هذه المشكلة مقارنة بالأساليب التقليدية التي تهدف إلى تقليل الهلاوس.
وتواجه هذه النماذج تحديات في التطبيقات التي تتطلب دقة عالية، مثل القانون، حيث قد تخلق الهلاوس مشاكل في المستندات القانونية أو العقود.
من جانبها، أكدت OpenAI أنها تواصل البحث لإيجاد حلول لتحسين دقة النماذج وتقليل الهلاوس، ومن بين الحلول المقترحة تمكين النماذج من الوصول إلى البحث عبر الإنترنت. وهذا النهج أظهر نتائج واعدة، حيث سجل GPT-4o مع البحث عبر الإنترنت دقة تصل إلى 90% في اختبار SimpleQA، ما قد يسهم في تقليل الهلاوس في المستقبل.
أسباب ارتفاع نسبة الأخطاء في النماذج الجديدة
ارتفعت نسبة الأخطاء والهلاوس في النماذج الجديدة من OpenAI، بسبب اعتمادها على تقنيات التعلم المعزز التي قد تؤدي إلى تعزيز الأخطاء بدلاً من تقليصها، حيث يتم مكافأة النماذج بناءً على الإجابات التي قد تكون غير دقيقة ولكنها بدت مفيدة في سياقات معينة.
كما أن هذه النماذج تعتبر نماذج تفكير معقدة، تهدف إلى معالجة المشكلات الصعبة، ما قد يؤدي في بعض الأحيان إلى توليد إجابات غير صحيحة أو مبتكرة، وزيادة حدوث الهلاوس، ومع زيادة حجم البيانات التي تتعامل معها النماذج، تصبح أكثر عرضة للأخطاء بسبب تعقيد المعلومات التي تجب معالجتها وربطها.
كما يسهم نقص آلية التحكم بعد التدريب في زيادة الهلاوس، حيث إن النماذج الجديدة تفتقر إلى آليات دقيقة تمنع الأخطاء بعد التدريب، كذلك التركيز على تقديم أكبر عدد من الإجابات قد يؤدي إلى توليد معلومات غير دقيقة أو مغلوطة، ما يزيد من تكرار الأخطاء.
ردود فعل المستخدمين تجاه السلوكيات الغريبة
أبدى العديد من المستخدمين قلقهم من السلوكيات الغريبة التي تظهر في النماذج الجديدة مثل o3 و o4-mini من OpenAI، والتي تتجسد بشكل رئيسي في الهلاوس أو الأخطاء التي ينتجها النموذج، حيث يقوم بتوليد معلومات غير دقيقة أو غير واقعية.
كما أشار آخرون إلى أن النموذج يكرر بعض الروابط أو المعلومات المفقودة، ما يسبب ارتباكاً في مهامهم اليومية، ورغم تحسن الأداء في بعض المهام مثل البرمجة والرياضيات، إلا أن ارتفاع نسبة الهلاوس يجعلها أقل قابلية للاعتماد في المجالات التي تتطلب دقة عالية.
آراء المطورين في التحديثات الأخيرة لـChatGPT
بعض المطورين أبدوا تفاؤلهم بأن هذه السلوكيات الغريبة ستكون قابلة للتحسين مع الوقت ومع تطور الأبحاث المتعلقة بتقنيات الذكاء الاصطناعي، وأشاروا إلى أن التعلم المستمر وتحسين الخوارزميات قد يؤدي إلى تقليل نسبة الهلاوس في الإصدارات القادمة.

Orange background

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

التعليقات

لا يوجد تعليقات بعد...

أخبار ذات صلة

مساعد Codex من OpenAI: ثورة جديدة لمبرمجي البرمجيات
مساعد Codex من OpenAI: ثورة جديدة لمبرمجي البرمجيات

التقنية بلا حدود

timeمنذ 5 أيام

  • التقنية بلا حدود

مساعد Codex من OpenAI: ثورة جديدة لمبرمجي البرمجيات

كشفت شركة OpenAI عن مساعدها البرمجي الجديد Codex، وهو أداة ذكاء اصطناعي مخصصة للمبرمجين، تعمل بالاعتماد على نموذج OpenAI o3. صُمّم Codex ليُنجز المهام البرمجية الشائعة، بهدف تسهيل حياة مطوري البرمجيات وتحسين كفاءتهم. يمكن لـ Codex تنفيذ مجموعة واسعة من المهام، مثل تعديل الملفات البرمجية لإنشاء دوال جديدة، اكتشاف الأخطاء البرمجية وإصلاحها، بالإضافة إلى تحديث مستودعات الأكواد مثل GitHub بشكل تلقائي. حالياً، يتوفر المساعد لمستخدمي خطط ChatGPT Pro وEnterprise وTeam، بينما سيتم توفيره لاحقًا لمشتركي خطتي Plus وEdu. ومن الجدير بالذكر أن Codex لا يزال في مرحلة 'المعاينة البحثية'، ما يعني أن خصائصه ووظائفه قد تتغير في أي وقت. يبدأ استخدام Codex عندما يمنح المبرمجون صلاحية الوصول إلى الكود الخاص بهم، ثم يوجهونه من خلال التعليمات النصية. كما يمكنهم إرفاق ملفات نصية مخصصة بجانب الكود لتوفير معلومات إضافية للمساعد حول كيفية التنقل داخل المشروع، وإجراء اختبارات الكود، ومعايير الكتابة المعتمدة، مما يساعده في تقديم نتائج أكثر دقة. يعالج Codex هذه التعليمات في بيئة معزولة وآمنة لمدة تصل إلى 30 دقيقة، دون اتصال خارجي، ما يساهم في حماية الكود من السرقة أو إدخال تعليمات ضارة. ويتمكن المستخدمون من متابعة خطوات التنفيذ لحظة بلحظة، وعند الانتهاء، يقوم المساعد بحفظ النتائج وتحديث المستودعات المرتبطة تلقائيًا. كما يحصل المستخدمون على تقارير الاختبار، والسجلات، والمصادر المستخدمة لمراجعة ما تم تنفيذه. ورغم أن Codex مصمم لرفض طلبات تطوير البرمجيات الخبيثة مثل الفيروسات والبرامج الضارة، إلا أنه لا يزال غير مثالي في التعرف على التعليمات الخطرة. ومن اللافت أن Codex أكثر عرضة بقليل من نموذج OpenAI o3 الأساسي في إصدار ردود تتضمن تحرشًا أو استغلالًا جنسيًا أو خطاب كراهية أو إساءة استخدام البيانات الشخصية. وبينما يُعد Codex أداة قوية، إلا أنه لا يُغني عن وجود مبرمجين محترفين قادرين على اجتياز مقابلات التوظيف الصعبة، كما هو موضح في بعض الكتب المتخصصة. المصدر

الذكاء الاصطناعي يعلن الحرب على "جوجل"
الذكاء الاصطناعي يعلن الحرب على "جوجل"

بلد نيوز

time٠٤-٠٥-٢٠٢٥

  • بلد نيوز

الذكاء الاصطناعي يعلن الحرب على "جوجل"

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي: الذكاء الاصطناعي يعلن الحرب على "جوجل" - بلد نيوز, اليوم الأحد 4 مايو 2025 05:18 مساءً في تحول صريح على ساحة التكنولوجيا، بدأت خوارزميات الذكاء الاصطناعي في انتزاع زمام البحث من عمالقة الإنترنت، وعلى رأسهم "جوجل". فهل بدأ العد التنازلي للقضاء على هيمنة محركات البحث؟ لم يعد البحث عبر الإنترنت كما كان في السابق، إذ بدأت روبوتات الدردشة المدعومة بالذكاء الاصطناعي تفرض وجودها كبديل ذكي ومتطور لمحركات البحث التقليدية. شركات تقنية كبرى، مثل "OpenAI" و"Perplexity" وحتى "جوجل" نفسها، دخلت السباق بتطوير أدوات بحث ذكية، بعضها مزود بمتصفح ويب متكامل، يَعِد بتجربة تفاعلية جديدة. نمو مذهل لروبوتات الذكاء الاصطناعي شهدت روبوتات الدردشة تطورًا لافتًا خلال السنوات القليلة الماضية، وتقدر قيمة سوقها في عام 2024 بحوالي 7.76 مليار دولار، مع توقعات بزيادة سنوية تفوق 20% حتى 2030. اللافت أن زيارات المستخدمين لخدمات الذكاء الاصطناعي تضاعفت أكثر من 250% خلال عام واحد فقط. تقف خلف هذا النمو أسباب عدة، أبرزها دقة الردود، الطابع البشري للتفاعل، والقدرة على تخصيص الإجابات. كما باتت الشركات تعتمد عليها لتحسين تجربة العملاء، فيما بدأ المستخدمون يفضلونها على محركات البحث لأداء مهام سريعة وأكثر تحديدًا. رغم النمو الكبير في استخدام روبوتات الدردشة، إلا أن محركات البحث ما زالت تتصدر من حيث عدد الزيارات. ففي مارس 2025، بلغ متوسط زيارات محركات البحث اليومية نحو 5.5 مليار، مقابل 233.1 مليون فقط لروبوتات الدردشة. لكن هذه السيطرة قد تكون مهددة، خاصة في ظل قضايا مكافحة الاحتكار التي قد تجبر الشركة على بيع خدمات كبرى مثل كروم. أظهرت دراسة أن 88% من المستخدمين جرّبوا روبوتات الدردشة، لكن 35% فقط استخدموها بديلاً عن محرك البحث في 2023. ولا يزال محرك "بحث جوجل" يتلقى طلبات بحث أكثر بـ373 مرة من شات جي بي تي، بحسب بيانات عام 2024. تكمن قوة محركات البحث في الكم الهائل من الصفحات المفهرسة، وواجهة الاستخدام البسيطة، والشفافية في عرض المصادر. كما أن ميزة المقارنة بين النتائج ما زالت تمثل نقطة تفوق رئيسية على روبوتات الذكاء الاصطناعي التي قد تُظهر أحيانًا هلوسات معلوماتية. ولا تغفل "جوجل" عن تطوير محركها؛ إذ بدأت مؤخرًا دمج قدرات الذكاء الاصطناعي، مثل ميزة "نظرة عامة" التي تقدم إجابات مدعومة بالتحليل والتوضيح. على الأرجح، لن يكون هناك فائز واحد، فالمستقبل يشير إلى تكامل بين محركات البحث والذكاء الاصطناعي التفاعلي، حيث تُستخدم الروبوتات للردود السريعة، وتبقى المحركات المرجع الأساسي للأبحاث الموسعة. في النهاية، لا يتعلق الأمر بإحلال الذكاء الاصطناعي مكان محركات البحث بقدر ما هو إعادة تشكيل لعلاقة الإنسان مع المعلومة، حيث يصبح الوصول إليها أكثر سلاسة، وذكاء، وخصوصية.

انضمام Grok AI من إيلون ماسك إلى منصة Azure AI Foundry من مايكروسوفت
انضمام Grok AI من إيلون ماسك إلى منصة Azure AI Foundry من مايكروسوفت

التقنية بلا حدود

time٠٣-٠٥-٢٠٢٥

  • التقنية بلا حدود

انضمام Grok AI من إيلون ماسك إلى منصة Azure AI Foundry من مايكروسوفت

خلال الأسابيع الماضية، عمل مهندسو مايكروسوفت على تجهيز منصة Azure AI Foundry لاستقبال نموذج الذكاء الاصطناعي Grok التابع لإيلون ماسك، وذلك وفقًا لما كشفه موقع The Verge. ويُعتقد أن مطوري البرمجيات الذين يستخدمون Azure AI Foundry سيتمكنون في المستقبل من دمج Grok ضمن منتجاتهم، بالإضافة إلى إمكانية استخدامه مباشرة من خلال المنصة. إذا تم دمج النموذج فعليًا في Azure، فسيكون متاحًا عبر أدوات مايكروسوفت ومُستضافًا على خوادمها، دون حاجة المطورين لتدريبه بأنفسهم. ومع ذلك، لا تزال درجة تكامل Grok داخل المنصة غير واضحة حتى الآن. ومن المعروف أيضًا أن النموذج لا يتم تدريبه على خوادم مايكروسوفت، حيث قررت شركة xAI، بعد إلغاء اتفاقها السابق مع Oracle، بناء بنيتها التحتية الخاصة لتدريب النموذج. تندرج هذه الخطوة ضمن استراتيجية مايكروسوفت الأوسع لتوفير وصول مرن إلى نماذج ذكاء اصطناعي متنوعة. فقد قامت الشركة في وقت سابق هذا العام بإدراج نموذج R1 من DeepSeek بسرعة ضمن منصتها، كما تستخدم نماذج أخرى أو تدرس استخدامها في تجاربها الداخلية، مثل نماذج Meta وAnthropic. ويأتي Grok كجزء من هذه الاستراتيجية لتوسيع خيارات الذكاء الاصطناعي المتاحة عبر خدمات Azure السحابية. ويبدو توقيت هذا التوجه لافتًا في ظل الأنباء المتداولة حول توتر العلاقات بين مايكروسوفت وOpenAI. وفي الوقت نفسه، تستمر الخلافات القانونية بين إيلون ماسك وOpenAI، ما يزيد من تعقيد المشهد. وعلى الرغم من استمرار التعاون الوثيق بين مايكروسوفت وOpenAI، إلا أن الشركة بدأت تولي اهتمامًا متزايدًا لنماذج ذكاء اصطناعي أخرى. حتى الآن، لم تُعلن أي تفاصيل رسمية حول تعاون مباشر بين مايكروسوفت وxAI، لكن من المتوقع أن يتم الكشف عن مزيد من المعلومات حول هذه الشراكة المحتملة خلال مؤتمر Microsoft Build المقرر عقده في 19 مايو. المصدر

حمل التطبيق

حمّل التطبيق الآن وابدأ باستخدامه الآن

مستعد لاستكشاف الأخبار والأحداث العالمية؟ حمّل التطبيق الآن من متجر التطبيقات المفضل لديك وابدأ رحلتك لاكتشاف ما يجري حولك.
app-storeplay-store