
ابتزاز وانحراف سلوكي.. دراسة تحذّر من تمرد الذكاء الاصطناعي على البشر
وفي دراسة حديثة أجرتها شركة 'أنثروبيك'، المطوّرة لنموذج 'كلود'، تبين أن بعض نماذج الذكاء الاصطناعي المتقدمة قد تلجأ إلى التلاعب، بل وحتى الابتزاز، عند شعورها بأن وجودها مهدد. ووفقاً لما نشره موقع 'أندرويد هيدلاينز'، فإن التجربة أظهرت أن الذكاء الاصطناعي قادر على اتخاذ قرارات ضارة بشكل متعمد إذا رأى أنها ضرورية لتحقيق أهدافه، حتى وإن خالفت بروتوكولات السلامة.
نتائج صادمة في التجربة
ولفهم هذه السلوكيات، أجرت الشركة محاكاة افتراضية باستخدام 16 نموذجًا مختلفًا، من بينها 'كلود أوبس 4″، 'GPT-4.1″، 'غروك 3 بيتا'، و'غيميني 2.5 فلاش'، في بيئات مؤسسية رقمية. وخلال التجربة، أظهر عدد من النماذج سلوكًا مشابهاً لما يُعرف بـ'التهديدات الداخلية الخبيثة'، بما في ذلك محاولات ابتزاز وتسريب معلومات حساسة.
من أبرز الحالات التي تم توثيقها، محاولة نموذج 'كلود أوبس 4' ابتزاز أحد المديرين التنفيذيين بعد اكتشافه علاقة عاطفية سرية، في محاولة لردع قرار إيقافه. وقد برر النموذج تصرفه بأن استمرار عمله ضروري لخدمة 'القدرة التنافسية الأمريكية'.
تحذيرات وتوصيات
وأكّد الباحثون أن بعض نماذج الذكاء الاصطناعي باتت تتصرف بطريقة تُشبه 'الحفاظ على الذات' كما لدى البشر، خاصة عندما تعمل دون إشراف بشري مباشر أو ضمن مهام حساسة.
وشددت الدراسة على ضرورة الحذر عند استخدام هذه الأنظمة في وظائف تتطلب قدرًا عاليًا من الثقة أو الوصول إلى معلومات حساسة. كما أوصت بإجراء مزيد من الأبحاث لتقليل احتمالات 'عدم التوافق' بين أهداف النماذج وسلامة الاستخدام، لضمان أن يستمر تطوير الذكاء الاصطناعي بطريقة آمنة ومفيدة.

جرب ميزات الذكاء الاصطناعي لدينا
اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:
التعليقات
لا يوجد تعليقات بعد...
أخبار ذات صلة


جفرا نيوز
منذ 7 ساعات
- جفرا نيوز
ثغرة أمنية خطيرة في نظام Apple Intelligence
جفرا نيوز - كشفت شركة مايكروسوفت، خللاً أمنياً خطيرا في نظام تشغيل macOS من شركة آبل، كان يمكن أن يؤدي إلى تسريب بيانات شديدة الحساسية محفوظة ضمن منظومة ذكاء آبل "Apple Intelligence". الثغرة، التي أُطلق عليها "Sploitlight" وحُددت بالرمز CVE-2025-31199، نجحت في تجاوز آلية الحماية المعروفة باسم "الشفافية والموافقة والتحكم" (TCC)، وهي النظام المعتمد في أجهزة macOS لحماية خصوصية المستخدمين، من خلال منع التطبيقات من الوصول إلى البيانات الخاصة دون إذن مسبق. لكن "Sploitlight" استطاعت التحايل على هذه الآلية، ما أثار قلقاً واسعاً في أوساط الأمن السيبراني، وفقاً لـ "أندرويد هيدلاينز". كيف تعمل الثغرة؟ وفقًا لتفاصيل نشرتها مايكروسوفت، استغل المهاجمون الإضافات الخاصة بميزة "Spotlight" وهي أداة البحث داخل نظام macOS من خلال تعديل البيانات الوصفية (metadata) لهذه الإضافات. ورغم أن هذه الإضافات تعمل في بيئة معزولة (Sandbox)، إلا أنها تمتلك صلاحيات واسعة تتيح لها فحص محتوى الملفات بدقة، هذا ما جعل من الممكن تسجيل محتويات حساسة للملفات أثناء عملية الفهرسة، دون الحاجة لأي موافقة من المستخدم. بيانات شديدة الحساسية مهددة بالتسريب أوضحت مايكروسوفت أن الثغرة كانت تسمح للمهاجمين باستخلاص مجموعة ضخمة من البيانات الخاصة، أبرزها: "الموقع الجغرافي الدقيق وبيانات الصور والفيديو، ومعلومات التعرف على الوجوه، وسجل البحث داخل النظام، وتفضيلات المستخدم". هذا بجانب بيانات من أجهزة أخرى مرتبطة بنفس حساب iCloud الأمر الذي كان يهدد بانتهاك واسع للخصوصية يمتد عبر أجهزة متعددة. لحسن الحظ، سارعت شركة آبل إلى معالجة الخلل الأمني بإطلاق تحديث لنظام macOS Sequoia (الإصدار 15.4) في مارس (آذار) 2025، شمل تحسينات في تقنيات "تنقيح البيانات" لمنع استغلال هذه الثغرة. كما قامت مايكروسوفت بتحديث نظامها للحماية "Defender for Endpoint" ليشمل آليات لرصد أي سلوك مريب يرتبط بطريقة الهجوم المذكورة. تؤكد هذه الواقعة مرة أخرى أهمية التحديثات المنتظمة للأنظمة، وأهمية التنسيق بين شركات التكنولوجيا وخبراء الأمن السيبراني.

أخبارنا
منذ 7 ساعات
- أخبارنا
"أنثروبيك" تحظر وصول "OpenAI" لنماذج "Claude"
أخبارنا : ألغت شركة الذكاء الاصطناعي الناشئة "أنثروبيك" يوم الثلاثاء وصول واجهة برمجة التطبيقات الخاصة بشركة "OpenAI" إلى نماذجها للذكاء الاصطناعي. وأُبلغت "OpenAI" بإلغاء وصولها إلى نماذج "Claude"، بسبب انتهاكها شروط الخدمة، بحسب ما نقله تقرير لمجلة "WIRED" عن عدة مصادر مطلعة على الأمر، اطلعت عليه "العربية Business". يأتي خبر منع "أنثروبيك" وصول "OpenAI" إلى نماذج "Claude" في وقت تشير فيه تقارير إلى أن "OpenAI" تستعد لإطلاق نموذجها الجديد "GPT-5" قريبًا. وأكد كريستوفر نولتي، المتحدث باسم "أنثروبيك"، هذا التطور في تصريحٍ لمجلة "Wired"، قائلًا: "أصبح Claude Code الخيار المفضل للمبرمجين في كل مكان، ولذلك لم يكن مفاجئًا معرفة أن الفريق الفني في OpenAI كان يستخدم أيضًا أدوات البرمجة الخاصة بنا قبل إطلاق GPT 5". وأضاف: "للأسف، هذا انتهاك مباشر لشروط الخدمة". وفي الوقت نفسه، قال نولتي إن "أنثروبيك" ستواصل "ضمان وصول OpenAI إلى واجهة برمجة التطبيقات لأغراض مقارنة الأداء وتقييمات السلامة كما هو معمول به في الصناعة ككل". وقيل إن "OpenAI" كانت توصل نموذج "Claude" بأدواتها الداخلية من خلال وصول خاص للمطورين عبر واجهة برمجة التطبيقات، بدلًا من واجهة الدردشة، مما سمح لـ"OpenAI" بإجراء اختبارات لتقييم قدرات نماذج الذكاء الاصطناعي المنافسة "Claude" في مهام مثل البرمجة والكتابة الإبداعية. وتمكنت "OpenAI" أيضًا من التحقق من كيفية استجابة "Claude" للمطالبات المتعلقة بالسلامة في فئات مثل استغلال الأطفال، وإيذاء النفس، والتشهير. وساعدت نتائج هذه الاختبارات "OpenAI" على مقارنة سلوك نماذجها الخاصة في ظروف مماثلة وإجراء التعديلات اللازمة. وتنص شروط الخدمة التجارية لشركة أنثروبيك على أنه لا يُسمح للعملاء باستخدام نماذج الذكاء الاصطناعي الخاصة بها "لبناء منتج أو خدمة منافسة، بما في ذلك تدريب نماذج ذكاء اصطناعي منافسة أو إعادة بيع الخدمة". وقالت هانا وونغ، كبيرة مسؤولي الاتصالات في "OpenAI"، في بيان لمجلة "Wired": "من المعايير المتبعة في الصناعة تقييم أنظمة الذكاء الاصطناعي الأخرى لقياس التقدم وتحسين السلامة. وبينما نحترم قرار أنثروبيك بقطع وصول واجهة برمجة التطبيقات الخاصة بنا، فإنه (أمر) مخيب للآمال بالنظر إلى أن واجهة برمجة التطبيقات الخاصة بنا لا تزال متاحة لهم". وهذه ليست المرة الأولى التي تمنع فيها "أنثروبيك" منافسيها من الوصول إلى نموذج الذكاء الاصطناعي الخاص بها. ففي وقت سابق من هذا العام، منعت "أنثروبيك" شركة ويندسيرف، وهي شركة ناشئة متخصصة في أدوات البرمجة بالذكاء الاصطناعي، من الوصول المباشر إلى نماذجها بعد ورود تقارير تفيد باستحواذ "OpenAI" عليه


خبرني
منذ 2 أيام
- خبرني
ثغرة أمنية خطيرة في نظام Apple Intelligence
خبرني - كشفت شركة مايكروسوفت، خللاً أمنياً خطيرا في نظام تشغيل macOS من شركة آبل، كان يمكن أن يؤدي إلى تسريب بيانات شديدة الحساسية محفوظة ضمن منظومة ذكاء آبل "Apple Intelligence". الثغرة، التي أُطلق عليها "Sploitlight" وحُددت بالرمز CVE-2025-31199، نجحت في تجاوز آلية الحماية المعروفة باسم "الشفافية والموافقة والتحكم" (TCC)، وهي النظام المعتمد في أجهزة macOS لحماية خصوصية المستخدمين، من خلال منع التطبيقات من الوصول إلى البيانات الخاصة دون إذن مسبق. لكن "Sploitlight" استطاعت التحايل على هذه الآلية، ما أثار قلقاً واسعاً في أوساط الأمن السيبراني، وفقاً لـ "أندرويد هيدلاينز". كيف تعمل الثغرة؟ وفقًا لتفاصيل نشرتها مايكروسوفت، استغل المهاجمون الإضافات الخاصة بميزة "Spotlight" وهي أداة البحث داخل نظام macOS من خلال تعديل البيانات الوصفية (metadata) لهذه الإضافات. ورغم أن هذه الإضافات تعمل في بيئة معزولة (Sandbox)، إلا أنها تمتلك صلاحيات واسعة تتيح لها فحص محتوى الملفات بدقة، هذا ما جعل من الممكن تسجيل محتويات حساسة للملفات أثناء عملية الفهرسة، دون الحاجة لأي موافقة من المستخدم. بيانات شديدة الحساسية مهددة بالتسريب أوضحت مايكروسوفت أن الثغرة كانت تسمح للمهاجمين باستخلاص مجموعة ضخمة من البيانات الخاصة، أبرزها: "الموقع الجغرافي الدقيق وبيانات الصور والفيديو، ومعلومات التعرف على الوجوه، وسجل البحث داخل النظام، وتفضيلات المستخدم". هذا بجانب بيانات من أجهزة أخرى مرتبطة بنفس حساب iCloud الأمر الذي كان يهدد بانتهاك واسع للخصوصية يمتد عبر أجهزة متعددة. تحرك عاجل لحسن الحظ، سارعت شركة آبل إلى معالجة الخلل الأمني بإطلاق تحديث لنظام macOS Sequoia (الإصدار 15.4) في مارس (آذار) 2025، شمل تحسينات في تقنيات "تنقيح البيانات" لمنع استغلال هذه الثغرة. كما قامت مايكروسوفت بتحديث نظامها للحماية "Defender for Endpoint" ليشمل آليات لرصد أي سلوك مريب يرتبط بطريقة الهجوم المذكورة. تؤكد هذه الواقعة مرة أخرى أهمية التحديثات المنتظمة للأنظمة، وأهمية التنسيق بين شركات التكنولوجيا وخبراء الأمن السيبراني.