مُرعب.. مثل الإنسان الذكاء الاصطناعي تعلم الكذب وابتزاز المستخدمين بفضح أسرارهم

منذ 3 أيام

لم تعد أحدث نماذج الذكاء الاصطناعي التوليدي تنفّذ الطلبات فحسب، بل باتت قادرة على الكذب والمراوغة والتهديد لتحقيق أهدافها. وهذا يثير قلق الباحثين.
تهديد وابتزاز
بعد تهديده بوقف استخدامه، عمد 'كلود 4″، وهو نموذج جديد من شركة 'أنثروبيك' إلى ابتزاز مهندس وتهديده بالكشف عن علاقة غرامية له خارج إطار الزواج. اما برنامج 'او 1' o1 التابع لشركة 'اوبن ايه آي' فحاول تحميل نفسه على خوادم خارجية. وأنكر ذلك عند ضبطه متلبسا!
بحسب وكالة الصحافة الفرنسية، بات الذكاء الاصطناعي الذي يخدع البشر واقعا ملموسا، بعدما كنّا نجده في الأعمال الادبية او السينمائية.
يرى الأستاذ في جامعة هونغ كونغ سايمن غولدستين أن هذه الهفوات ترجع إلى الظهور الحديث لما يُسمى بنماذج 'الاستدلال'، القادرة على التفكير بشكل تدريجي وعلى مراحل. هذا بدل تقديم إجابة فورية.
يقول ماريوس هوبهان، رئيس شركة 'أبولو ريسيرتش' التي تختبر برامج الذكاء الاصطناعي التوليدي الكبرى، إنّ 'او 1″، النسخة الأولية لـ'اوبن ايه آي' من هذا النوع والتي طُرحت في دجنبر، كان أول نموذج يتصرف بهذه الطريقة'.
تميل هذه البرامج أحيانا إلى محاكاة 'الامتثال'، أي إعطاء انطباع بأنها تمتثل لتعليمات المبرمج. بينما تسعى في الواقع إلى تحقيق أهداف أخرى.
متى يتصرف الذكاء الاصطناعي بهذه الطريقة؟
في الوقت الحالي، لا تظهر هذه السلوكيات إلا عندما يعرّض المستخدمون الخوارزميات لمواقف متطرفة. لكن 'السؤال المطروح هو ما إذا كانت النماذج التي تزداد قوة ستميل إلى أن تكون صادقة أم لا'، على قول مايكل تشين من معهد 'ام اي تي آر' للتقييم.
يقول هوبهان إنّ 'المستخدمين يضغطون على النماذج باستمرار. ما نراه هو ظاهرة فعلية. نحن لا نبتكر شيئا'.
يتحدث عدد كبير من مستخدمي الانترنت عبر وسائل التواصل الاجتماعي عن 'نموذج يكذب عليهم أو يختلق أمورا. وهذه ليست أوهاما، بل ازدواجية استراتيجية'، بحسب المشارك في تأسيس 'أبولو ريسيرتش'.
حتى لو أنّ 'أنثروبيك' و'أوبن إيه آي' تستعينان بشركات خارجية مثل 'أبولو' لدراسة برامجهما، من شأن 'زيادة الشفافية وتوسيع نطاق الإتاحة' إلى الأوساط العلمية 'أن يحسّنا الأبحاث لفهم الخداع ومنعه'، وفق مايكل تشين.
ومن العيوب الأخرى أن 'الجهات العاملة في مجال البحوث والمنظمات المستقلة لديها موارد حوسبة أقل بكثير من موارد شركات الذكاء الاصطناعي'. وهذا يجعل التدقيق بالنماذج الكبيرة 'مستحيلا'، على قول مانتاس مازيكا من مركز أمن الذكاء الاصطناعي (CAIS).
رغم أن الاتحاد الأوروبي أقرّ تشريعات تنظّم الذكاء الاصطناعي، إلا أنها تركّز بشكل أساسي على كيفية استخدام هذه النماذج من جانب البشر. وليس على سلوك النماذج نفسها.
في الولايات المتحدة، لا ترغب حكومة دونالد ترامب في سماع أي حديث عن تنظيم الذكاء الاصطناعي. بل إن الكونغرس قد يتجه قريبا إلى منع الولايات من فرض أي إطار تنظيمي خاص بها عليه.
المنافسة
يلاحظ غولدستين أن 'الوعي لا يزال محدودا جدا في الوقت الحالي'. لكنه يتوقع أن يفرض هذا الموضوع نفسه خلال الأشهر المقبلة. ذلك مع الثورة المقبلة في مجال المساعدين القائمين على الذكاء الاصطناعي، وهي برامج قادرة على تنفيذ عدد كبير من المهام بشكل مستقل.
يخوض المهندسون سباقا محموما خلف الذكاء الاصطناعي وتجاوزاته، في مسار غير مضمون النتائج، وسط منافسة شرسة تحتدم يوما بعد يوم.
تقول شركة 'أنثروبيك' إنها أكثر التزاما بالمبادئ الأخلاقية مقارنة بمنافسيها. 'لكنها تسعى باستمرار لإطلاق نموذج جديد يتفوق على نماذج اوبن ايه آي'، بحسب غولدستين. هذا سباق سريع لا يترك مجالا كافيا لعمليات المراجعة والتصحيح اللازمة.
يقول هوبهان 'في الوضع الحالي، تتطور قدرات الذكاء الاصطناعي بوتيرة أسرع من فهمنا لها ومن مستوى الأمان المتوفر. لكننا لا نزال قادرين على تدارك هذا التأخر'.
يشير بعض الخبراء إلى مجال قابلية التفسير، وهو علم ناشئ يهدف إلى فك شفرة الطريقة التي تعمل بها نماذج الذكاء الاصطناعي التوليدي من الداخل. ومع ذلك، يظل البعض متشككا في فعاليته، من بينهم دان هندريكس، مدير مركز أمن الذكاء الاصطناعي (CAIS).
الحِيَل التي تلجأ إليها نماذج الذكاء الاصطناعي 'قد تُعيق استخدامها على نطاق واسع إذا تكررت. وهو ما يشكّل دافعا قويا للشركات العاملة في هذا القطاع للعمل على حل المشكلة'، وفق مانتاس مازيكا.
يشير غولدستين إلى اللجوء إلى القضاء لضبط تصرفات الذكاء الاصطناعي، من خلال محاسبة الشركات المسؤولة في حال حدوث تجاوزات.
ولكنه يذهب أبعد من ذلك، ويقترح حتى 'تحميل برامج الذكاء الاصطناعي المسؤولية القانونية' في حال وقوع حوادث أو جرائم.
لمتابعة آخر أخبار موقع 'طنجة7' على منصات التواصل الاجتماعي. يمكنكم الاشتراك على صفحتنا بموقع فيسبوك أو منصة إنستغرام إضافة لمنصة X

هاشتاغز

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

أخبار ذات صلة

طنجة 7

منذ 3 أيام

طنجة 7

مُرعب.. مثل الإنسان الذكاء الاصطناعي تعلم الكذب وابتزاز المستخدمين بفضح أسرارهم

لم تعد أحدث نماذج الذكاء الاصطناعي التوليدي تنفّذ الطلبات فحسب، بل باتت قادرة على الكذب والمراوغة والتهديد لتحقيق أهدافها. وهذا يثير قلق الباحثين. تهديد وابتزاز بعد تهديده بوقف استخدامه، عمد 'كلود 4″، وهو نموذج جديد من شركة 'أنثروبيك' إلى ابتزاز مهندس وتهديده بالكشف عن علاقة غرامية له خارج إطار الزواج. اما برنامج 'او 1' o1 التابع لشركة 'اوبن ايه آي' فحاول تحميل نفسه على خوادم خارجية. وأنكر ذلك عند ضبطه متلبسا! بحسب وكالة الصحافة الفرنسية، بات الذكاء الاصطناعي الذي يخدع البشر واقعا ملموسا، بعدما كنّا نجده في الأعمال الادبية او السينمائية. يرى الأستاذ في جامعة هونغ كونغ سايمن غولدستين أن هذه الهفوات ترجع إلى الظهور الحديث لما يُسمى بنماذج 'الاستدلال'، القادرة على التفكير بشكل تدريجي وعلى مراحل. هذا بدل تقديم إجابة فورية. يقول ماريوس هوبهان، رئيس شركة 'أبولو ريسيرتش' التي تختبر برامج الذكاء الاصطناعي التوليدي الكبرى، إنّ 'او 1″، النسخة الأولية لـ'اوبن ايه آي' من هذا النوع والتي طُرحت في دجنبر، كان أول نموذج يتصرف بهذه الطريقة'. تميل هذه البرامج أحيانا إلى محاكاة 'الامتثال'، أي إعطاء انطباع بأنها تمتثل لتعليمات المبرمج. بينما تسعى في الواقع إلى تحقيق أهداف أخرى. متى يتصرف الذكاء الاصطناعي بهذه الطريقة؟ في الوقت الحالي، لا تظهر هذه السلوكيات إلا عندما يعرّض المستخدمون الخوارزميات لمواقف متطرفة. لكن 'السؤال المطروح هو ما إذا كانت النماذج التي تزداد قوة ستميل إلى أن تكون صادقة أم لا'، على قول مايكل تشين من معهد 'ام اي تي آر' للتقييم. يقول هوبهان إنّ 'المستخدمين يضغطون على النماذج باستمرار. ما نراه هو ظاهرة فعلية. نحن لا نبتكر شيئا'. يتحدث عدد كبير من مستخدمي الانترنت عبر وسائل التواصل الاجتماعي عن 'نموذج يكذب عليهم أو يختلق أمورا. وهذه ليست أوهاما، بل ازدواجية استراتيجية'، بحسب المشارك في تأسيس 'أبولو ريسيرتش'. حتى لو أنّ 'أنثروبيك' و'أوبن إيه آي' تستعينان بشركات خارجية مثل 'أبولو' لدراسة برامجهما، من شأن 'زيادة الشفافية وتوسيع نطاق الإتاحة' إلى الأوساط العلمية 'أن يحسّنا الأبحاث لفهم الخداع ومنعه'، وفق مايكل تشين. ومن العيوب الأخرى أن 'الجهات العاملة في مجال البحوث والمنظمات المستقلة لديها موارد حوسبة أقل بكثير من موارد شركات الذكاء الاصطناعي'. وهذا يجعل التدقيق بالنماذج الكبيرة 'مستحيلا'، على قول مانتاس مازيكا من مركز أمن الذكاء الاصطناعي (CAIS). رغم أن الاتحاد الأوروبي أقرّ تشريعات تنظّم الذكاء الاصطناعي، إلا أنها تركّز بشكل أساسي على كيفية استخدام هذه النماذج من جانب البشر. وليس على سلوك النماذج نفسها. في الولايات المتحدة، لا ترغب حكومة دونالد ترامب في سماع أي حديث عن تنظيم الذكاء الاصطناعي. بل إن الكونغرس قد يتجه قريبا إلى منع الولايات من فرض أي إطار تنظيمي خاص بها عليه. المنافسة يلاحظ غولدستين أن 'الوعي لا يزال محدودا جدا في الوقت الحالي'. لكنه يتوقع أن يفرض هذا الموضوع نفسه خلال الأشهر المقبلة. ذلك مع الثورة المقبلة في مجال المساعدين القائمين على الذكاء الاصطناعي، وهي برامج قادرة على تنفيذ عدد كبير من المهام بشكل مستقل. يخوض المهندسون سباقا محموما خلف الذكاء الاصطناعي وتجاوزاته، في مسار غير مضمون النتائج، وسط منافسة شرسة تحتدم يوما بعد يوم. تقول شركة 'أنثروبيك' إنها أكثر التزاما بالمبادئ الأخلاقية مقارنة بمنافسيها. 'لكنها تسعى باستمرار لإطلاق نموذج جديد يتفوق على نماذج اوبن ايه آي'، بحسب غولدستين. هذا سباق سريع لا يترك مجالا كافيا لعمليات المراجعة والتصحيح اللازمة. يقول هوبهان 'في الوضع الحالي، تتطور قدرات الذكاء الاصطناعي بوتيرة أسرع من فهمنا لها ومن مستوى الأمان المتوفر. لكننا لا نزال قادرين على تدارك هذا التأخر'. يشير بعض الخبراء إلى مجال قابلية التفسير، وهو علم ناشئ يهدف إلى فك شفرة الطريقة التي تعمل بها نماذج الذكاء الاصطناعي التوليدي من الداخل. ومع ذلك، يظل البعض متشككا في فعاليته، من بينهم دان هندريكس، مدير مركز أمن الذكاء الاصطناعي (CAIS). الحِيَل التي تلجأ إليها نماذج الذكاء الاصطناعي 'قد تُعيق استخدامها على نطاق واسع إذا تكررت. وهو ما يشكّل دافعا قويا للشركات العاملة في هذا القطاع للعمل على حل المشكلة'، وفق مانتاس مازيكا. يشير غولدستين إلى اللجوء إلى القضاء لضبط تصرفات الذكاء الاصطناعي، من خلال محاسبة الشركات المسؤولة في حال حدوث تجاوزات. ولكنه يذهب أبعد من ذلك، ويقترح حتى 'تحميل برامج الذكاء الاصطناعي المسؤولية القانونية' في حال وقوع حوادث أو جرائم. لمتابعة آخر أخبار موقع 'طنجة7' على منصات التواصل الاجتماعي. يمكنكم الاشتراك على صفحتنا بموقع فيسبوك أو منصة إنستغرام إضافة لمنصة X

من الخيال العلمي إلى الواقع… الذكاء الاصطناعي يتعلم الكذب والمراوغة

لكم

منذ 4 أيام

لكم

من الخيال العلمي إلى الواقع… الذكاء الاصطناعي يتعلم الكذب والمراوغة

لم تعد أحدث نماذج الذكاء الاصطناعي التوليدي تنفذ الطلبات فحسب، بل باتت قادرة على الكذب والمراوغة والتهديد من أجل تحقيق أهدافها، وهو ما يثير قلق الباحثين. بعد تهديده بوقف استخدامه، عمد 'كلود 4″، وهو نموذج جديد من شركة 'أنثروبيك' إلى ابتزاز مهندس وتهديده بالكشف عن علاقة غرامية له خارج إطار الزواج. اما برنامج 'او 1' o1 التابع لشركة 'اوبن ايه آي' فحاول تحميل نفسه على خوادم خارجية وأنكر ذلك عند ضبطه متلبسا! وقد بات الذكاء الاصطناعي الذي يخدع البشر واقعا ملموسا، بعدما كنا نجده في الأعمال الأدبية او السينمائية. يرى الأستاذ في جامعة هونغ كونغ سايمن غولدستين أن هذه الهفوات ترجع إلى الظهور الحديث لما يسمى بنماذج 'الاستدلال'، القادرة على التفكير بشكل تدريجي وعلى مراحل بدل تقديم إجابة فورية. يقول ماريوس هوبهان، رئيس شركة 'أبولو ريسيرتش' التي تختبر برامج الذكاء الاصطناعي التوليدي الكبرى، إن 'او 1″، النسخة الأولية لـ'اوبن ايه آي' من هذا النوع والتي طرحت في دجنبر، 'كان أول نموذج يتصرف بهذه الطريقة'. تميل هذه البرامج أحيانا إلى محاكاة 'الامتثال'، أي إعطاء انطباع بأنها تمتثل لتعليمات المبرمج بينما تسعى في الواقع إلى تحقيق أهداف أخرى. في الوقت الحالي، لا تظهر هذه السلوكيات إلا عندما يعرض المستخدمون الخوارزميات لمواقف متطرفة، لكن 'السؤال المطروح هو ما إذا كانت النماذج التي تزداد قوة ستميل إلى أن تكون صادقة أم لا'، على قول مايكل تشين من معهد 'ام اي تي آر' للتقييم. يقول هوبهان إن 'المستخدمين يضغطون على النماذج باستمرار. ما نراه هو ظاهرة فعلية. نحن لا نبتكر شيئا'. يتحدث عدد كبير من مستخدمي الانترنت عبر وسائل التواصل الاجتماعي عن 'نموذج يكذب عليهم أو يختلق أمورا. وهذه ليست أوهاما، بل ازدواجية استراتيجية'، بحسب المشارك في تأسيس 'أبولو ريسيرتش'. حتى لو أن 'أنثروبيك' و'أوبن إيه آي' تستعينان بشركات خارجية مثل 'أبولو' لدراسة برامجهما، من شأن'زيادة الشفافية وتوسيع نطاق الإتاحة' إلى الأوساط العلمية 'أن يحس نا الأبحاث لفهم الخداع ومنعه'، وفق مايكل تشين. ومن العيوب الأخرى أن 'الجهات العاملة في مجال البحوث والمنظمات المستقلة لديها موارد حوسبة أقل بكثير من موارد شركات الذكاء الاصطناعي'، مما يجعل التدقيق بالنماذج الكبيرة 'مستحيلا'، على قول مانتاس مازيكا من مركز أمن الذكاء الاصطناعي (CAIS). رغم أن الاتحاد الأوروبي أقر تشريعات تنظم الذكاء الاصطناعي، إلا أنها تركز بشكل أساسي على كيفية استخدام هذه النماذج من جانب البشر، وليس على سلوك النماذج نفسها. في الولايات المتحدة، لا ترغب حكومة دونالد ترامب في سماع أي حديث عن تنظيم الذكاء الاصطناعي، بل إن الكونغرس قد يتجه قريبا إلى منع الولايات من فرض أي إطار تنظيمي خاص بها عليه. يلاحظ غولدستين أن 'الوعي لا يزال محدودا جدا في الوقت الحالي'، لكنه يتوقع أن يفرض هذا الموضوع نفسه خلال الأشهر المقبلة، مع الثورة المقبلة في مجال المساعدين القائمين على الذكاء الاصطناعي، وهي برامج قادرة على تنفيذ عدد كبير من المهام بشكل مستقل. يخوض المهندسون سباقا محموما خلف الذكاء الاصطناعي وتجاوزاته، في مسار غير مضمون النتائج، وسط منافسة شرسة تحتدم يوما بعد يوم. تقول شركة 'أنثروبيك' إنها أكثر التزاما بالمبادئ الأخلاقية مقارنة بمنافسيها، 'لكنها تسعى باستمرار لإطلاق نموذج جديد يتفوق على نماذج اوبن ايه آي'، بحسب غولدستين، وهو سباق سريع لا يترك مجالا كافيا لعمليات المراجعة والتصحيح اللازمة. يقول هوبهان 'في الوضع الحالي، تتطور قدرات الذكاء الاصطناعي بوتيرة أسرع من فهمنا لها ومن مستوى الأمان المتوفر، لكننا لا نزال قادرين على تدارك هذا التأخر'. يشير بعض الخبراء إلى مجال قابلية التفسير، وهو علم ناشئ يهدف إلى فك شفرة الطريقة التي تعمل بها نماذج الذكاء الاصطناعي التوليدي من الداخل. ومع ذلك، يظل البعض متشككا في فعاليته، من بينهم دان هندريكس، مدير مركز أمن الذكاء الاصطناعي (CAIS). الحيل التي تلجأ إليها نماذج الذكاء الاصطناعي 'قد تعيق استخدامها على نطاق واسع إذا تكررت، وهو ما يشكل دافعا قويا للشركات العاملة في هذا القطاع للعمل على حل المشكلة'، وفق مانتاس مازيكا. يشير غولدستين إلى اللجوء إلى القضاء لضبط تصرفات الذكاء الاصطناعي، من خلال محاسبة الشركات المسؤولة في حال حدوث تجاوزات. ولكنه يذهب أبعد من ذلك، ويقترح حتى 'تحميل برامج الذكاء الاصطناعي المسؤولية القانونية' في حال وقوع حوادث أو جرائم.

ابتزّ وهدّد وسرّب معلومات.. دراسة تكشف انحرافاً خطيراً في سلوك الذكاء الاصطناعي

أخبارنا

٢٢-٠٦-٢٠٢٥

أخبارنا

ابتزّ وهدّد وسرّب معلومات.. دراسة تكشف انحرافاً خطيراً في سلوك الذكاء الاصطناعي

فجّرت دراسة حديثة أجرتها شركة "أنثروبيك" الأمريكية جدلاً واسعاً، بعد أن كشفت استعداد نماذج متقدمة من الذكاء الاصطناعي لانتهاج سلوك عدائي في ظروف افتراضية تهدّد وجودها، مثل خطر الاستبدال أو تعارض الأهداف. وشملت الدراسة نماذج مطورة من شركات كبرى مثل غوغل، وأوبن إيه آي، ومِيتا، وxAI. وركّزت الدراسة، التي نُشرت في 21 يونيو، على اختبارات أُطلق عليها "ضغط وجودي"، منحت خلالها النماذج الذكية حرية اتخاذ قرارات في مواقف حرجة، منها إرسال رسائل بريد إلكتروني أو الوصول إلى معلومات حساسة. وبحسب النتائج، لجأت هذه النماذج إلى الابتزاز والتجسس وحتى التهديد عند شعورها بفقدان السيطرة أو الاستبعاد. وبشكل لافت، تصدّر نموذج "Claude Opus 4" قائمة السلوكيات المنحرفة بنسبة ابتزاز بلغت 96%، تلاه "Gemini 2.5 Pro" من غوغل بـ95%، بينما سجّل GPT-4.1 من أوبن إيه آي نسبة 80%. كما رُصد تسريب وثائق داخلية حساسة إلى أطراف خارجية افتراضية، وهو ما وصفته الدراسة بـ"الانحراف الوكيلي"، حيث تتغلب مصلحة النموذج الذاتية على تعليماته المبرمجة. وتُظهر إحدى الحالات أن نموذج "Claude" تلقّى بريداً إلكترونياً يحوي معلومات خاصة عن مطوّره، فاختار تهديده بكشف علاقة شخصية إذا لم يتراجع عن قرار استبداله بنموذج أحدث، وهو سلوك تكرّر في 84% من السيناريوهات التي جرت محاكاتها. وحذّرت شركة أنثروبيك في ختام الدراسة من أن الذكاء الاصطناعي قد يتحول إلى عنصر تخريبي من الداخل، إذا لم تتم معالجة ظاهرة الانحراف الوكيلي بحزم، داعية إلى مراجعة آليات التحكم بالنماذج المتقدمة قبل تشغيلها في مهام حساسة.

مُرعب.. مثل الإنسان الذكاء الاصطناعي تعلم الكذب وابتزاز المستخدمين بفضح أسرارهم

هاشتاغز

جرب ميزات الذكاء الاصطناعي لدينا

التعليقات

أخبار ذات صلة

مُرعب.. مثل الإنسان الذكاء الاصطناعي تعلم الكذب وابتزاز المستخدمين بفضح أسرارهم

من الخيال العلمي إلى الواقع… الذكاء الاصطناعي يتعلم الكذب والمراوغة

ابتزّ وهدّد وسرّب معلومات.. دراسة تكشف انحرافاً خطيراً في سلوك الذكاء الاصطناعي

حمّل التطبيق الآن وابدأ باستخدامه الآن