أحدث الأخبار مع #وريتشاردساتون


الاتحاد
٢٠-٠٤-٢٠٢٥
- علوم
- الاتحاد
وداعاً للأسئلة والأجوبة.. الذكاء الاصطناعي يتعلم بنفسه!
أعلنت وحدة "ديب مايند" التابعة لجوجل أن الذكاء الاصطناعي وصل إلى نقطة تحول حاسمة، تجاوز فيها حدود المعرفة البشرية، وبدأ يدخل ما يسمى بـ"عصر التجربة"، وهو نهج جديد يمكّن نماذج الذكاء الاصطناعي من التعلم من البيئة المحيطة بها مباشرة، دون الاعتماد على "أحكام مسبقة" من البشر. في ورقة بحثية جديدة، أوضح العالمان البارزان ديفيد سيلفر وريتشارد ساتون أن الطريقة الحالية في تدريب نماذج الذكاء الاصطناعي – التي تعتمد على بيانات ثابتة ومحدودة – تقيد قدرات الذكاء الاصطناعي وتمنعه من التطور. بدلاً من ذلك، يدعون إلى نهج جديد أطلقوا عليه اسم "Streams" "الجداول أو التيارات"، يتيح للذكاء الاصطناعي التعلم من سلسلة تجاربه المستمرة في العالم الحقيقي، كما يتعلم البشر على مدار حياتهم، ذلك وفقا لما نشره موقع zdnet التقني. من التفاعل القصير إلى التعلّم المستمر بحسب الباحثين، فإن النماذج الحالية، مثل ChatGPT، تركز على تفاعلات قصيرة مع المستخدمين، دون أن تحتفظ بذاكرة أو قدرة على التعلم من السياق طويل الأمد. أما في "عصر التجربة"، فستكون النماذج قادرة على التفاعل مع البيئة، واكتشاف المعرفة، وتحديث نفسها باستمرار بناءً على إشارات واقعية مثل: معدلات الخطأ، الصحة، الإنتاجية، الأرباح، المؤشرات البيئية، وغيرها. اقرأ أيضاً.. جوجل تتحدث مع الدلافين.. ذكاء اصطناعي يفك شيفرة تواصل عالم المحيطات العودة إلى التعزيز الذاتي يعتمد هذا النهج على تقنيات "التعلم المعزز" (Reinforcement Learning)، التي سبق أن استخدمتها ديب مايند في تطوير AlphaZero – النموذج الذي تفوّق على البشر في الشطرنج ولعبة Go. ويرى سيلفر وساتون أن التخلي عن التعلم المعزز في عصر "الذكاء الاصطناعي التوليدي" أدى إلى فقدان النماذج القدرة على "اكتشاف المعرفة الذاتية". اقرأ أيضاً.. جوجل تطرح ميزات ذكية لرحلات صيفية مثالية نحو ذكاء عام فائق يرى الباحثان أن "عصر التجربة" سيولد بيانات أضخم وأكثر تنوعًا من أي موسوعة بشرية، مما يقربنا من تحقيق "الذكاء الاصطناعي العام" وربما "الذكاء الخارق". ومن التطبيقات المحتملة: مساعدين صحيين يتابعون نمط حياة الإنسان عبر سنوات، أو وكلاء علميين يكتشفون مواد جديدة أو حلولاً بيئية مستدامة. تحذيرات ومخاوف رغم التفاؤل، يحذر الباحثان من مخاطر الذكاء الاصطناعي القادر على العمل المستقل طويل الأمد، مثل صعوبة تدخل البشر لتعديل سلوكه. لكن بالمقابل، يمكن للنموذج أن يطور وعياً ذاتياً اجتماعياً، فيتجنب إثارة قلق البشر أو استيائهم. ويختم الباحثان بأن هذا التحول يمثل نقلة نوعية ستغير شكل المستقبل كلياً، مشيرين إلى أن البيانات المكتسبة بالتجربة ستتفوق من حيث الكم والنوع على كل ما أنتجه البشر من محتوى حتى الآن. إسلام العبادي(أبوظبي)


الاتحاد
٠٩-٠٣-٢٠٢٥
- علوم
- الاتحاد
«المتعة والألم».. سر نجاح الـ AI
بوسطن (الاتحاد) فاز العالمان أندرو بارتو وريتشارد ساتون الأسبوع الماضي بجائزة نوبل للحوسبة المعروفة باسم «تورينج» من جمعية آلات الحوسبة، التي تعد أكبر جمعية في العالم لمحترفي الحوسبة. نال الباحثان البارزان الجائزة المرموقة عن إسهامهما الرائد في اكتشاف وتمكين الذكاء الاصطناعي، قبل عقود طويلة من ظهوره بشكل فعلي. يتمحور الإنجاز الأساسي للعالمين في ابتكار ما يعرف باسم «التعليم المعزز»، وهي التقنية الأساسية التي ساعدت على تطوير القدرات الخارقة للذكاء الاصطناعي. تقول صحيفة نيويورك تايمز، إن البداية كانت في عام 1977، عندما بدأ أندرو بارتو، كباحث في جامعة ماساتشوستس، أمهيرست، في استكشاف نظرية جديدة مفادها أن الخلايا العصبية عند الإنسان تتصرف مثل الشخص الشهواني، حيث تسعى مليارات الخلايا العصبية في الدماغ البشرية إلى تعظيم المتعة وتقليل الألم، ومع انضمام الباحث الشاب ريتشارد ساتون إلى بارتو، بدأ الاثنان استخدام هذه المفهوم للذكاء البشري وتطبيقه على الذكاء الاصطناعي. وكانت النتيجة «التعلم المعزز»، وهي طريقة لأنظمة الذكاء الاصطناعي للتعلم من المكافئ الرقمي للمتعة والألم، حسبما تقول «نيويورك تايمز» ولعب «التعلم المعزز» دوراً حيوياً في صعود الذكاء الاصطناعي خلال العقد الماضي حتى إن تقنيات متقدمة مثل ChatGPT من OpenAI، جذورها الأساسية تكمن في جهود بارتو وساتون بشأن التعليم المعزز، خاصة في كتابهما الصادر عام 1998 بعنوان «التعلم المعزز: مقدمة» الذي بشرا فيه بأنه يمكن للآلات أن تتعلم بنفس الطريقة التي يتعلم بها الإنسان. استفادت جوجل من النظرية في بناء نظام ذكي للعب الشطرنج أسمته AlphaGo في عام 2016. لعب النظام لعب ملايين الألعاب ضد نفسه، وتعلم عن طريق التجربة والخطأ حتى عرف الحركات التي جلبت النجاح (المتعة) وأيها جلبت الفشل (الألم). ومن هنا، بدأ التفكير في استخدام فكرة التعليم المعزز خارج نطاق الألعاب، حيث يمكن للآلات التمييز بين النجاح والفشل حتى وصلنا إلى مرحلة روبوتات الدردشة. وقد لعب التعلم المعزز دوراً أساسياً في تطوير روبوتات الدردشة عبر الإنترنت، التي علمت نفسها بنفسها عبر ردود الفعل البشرية في بداية تجاربها الأولى. تقول نيويورك تايمز، إنه في الفترة التي سبقت إصدار ChatGPT في خريف عام 2022، استأجرت OpenAI مئات الأشخاص لاستخدام إصدار مبكر وتقديم اقتراحات دقيقة يمكن أن تصقل مهاراتها. ويسمي الباحثون هذا النموذج.. «التعلم المعزز من ردود الفعل البشرية»، وهو أحد الأسباب الرئيسية التي تجعل روبوتات الدردشة اليوم تستجيب بطرق نابضة بالحياة بشكل مدهش.