أحدث الأخبار مع #أندروبارتو

الاتحاد

٠٩-٠٣-٢٠٢٥

علوم
الاتحاد

«المتعة والألم».. سر نجاح الـ AI

بوسطن (الاتحاد) فاز العالمان أندرو بارتو وريتشارد ساتون الأسبوع الماضي بجائزة نوبل للحوسبة المعروفة باسم «تورينج» من جمعية آلات الحوسبة، التي تعد أكبر جمعية في العالم لمحترفي الحوسبة. نال الباحثان البارزان الجائزة المرموقة عن إسهامهما الرائد في اكتشاف وتمكين الذكاء الاصطناعي، قبل عقود طويلة من ظهوره بشكل فعلي. يتمحور الإنجاز الأساسي للعالمين في ابتكار ما يعرف باسم «التعليم المعزز»، وهي التقنية الأساسية التي ساعدت على تطوير القدرات الخارقة للذكاء الاصطناعي. تقول صحيفة نيويورك تايمز، إن البداية كانت في عام 1977، عندما بدأ أندرو بارتو، كباحث في جامعة ماساتشوستس، أمهيرست، في استكشاف نظرية جديدة مفادها أن الخلايا العصبية عند الإنسان تتصرف مثل الشخص الشهواني، حيث تسعى مليارات الخلايا العصبية في الدماغ البشرية إلى تعظيم المتعة وتقليل الألم، ومع انضمام الباحث الشاب ريتشارد ساتون إلى بارتو، بدأ الاثنان استخدام هذه المفهوم للذكاء البشري وتطبيقه على الذكاء الاصطناعي. وكانت النتيجة «التعلم المعزز»، وهي طريقة لأنظمة الذكاء الاصطناعي للتعلم من المكافئ الرقمي للمتعة والألم، حسبما تقول «نيويورك تايمز» ولعب «التعلم المعزز» دوراً حيوياً في صعود الذكاء الاصطناعي خلال العقد الماضي حتى إن تقنيات متقدمة مثل ChatGPT من OpenAI، جذورها الأساسية تكمن في جهود بارتو وساتون بشأن التعليم المعزز، خاصة في كتابهما الصادر عام 1998 بعنوان «التعلم المعزز: مقدمة» الذي بشرا فيه بأنه يمكن للآلات أن تتعلم بنفس الطريقة التي يتعلم بها الإنسان. استفادت جوجل من النظرية في بناء نظام ذكي للعب الشطرنج أسمته AlphaGo في عام 2016. لعب النظام لعب ملايين الألعاب ضد نفسه، وتعلم عن طريق التجربة والخطأ حتى عرف الحركات التي جلبت النجاح (المتعة) وأيها جلبت الفشل (الألم). ومن هنا، بدأ التفكير في استخدام فكرة التعليم المعزز خارج نطاق الألعاب، حيث يمكن للآلات التمييز بين النجاح والفشل حتى وصلنا إلى مرحلة روبوتات الدردشة. وقد لعب التعلم المعزز دوراً أساسياً في تطوير روبوتات الدردشة عبر الإنترنت، التي علمت نفسها بنفسها عبر ردود الفعل البشرية في بداية تجاربها الأولى. تقول نيويورك تايمز، إنه في الفترة التي سبقت إصدار ChatGPT في خريف عام 2022، استأجرت OpenAI مئات الأشخاص لاستخدام إصدار مبكر وتقديم اقتراحات دقيقة يمكن أن تصقل مهاراتها. ويسمي الباحثون هذا النموذج.. «التعلم المعزز من ردود الفعل البشرية»، وهو أحد الأسباب الرئيسية التي تجعل روبوتات الدردشة اليوم تستجيب بطرق نابضة بالحياة بشكل مدهش.

رائدا الذكاء الاصطناعى أندرو بارتو وريتشارد سوتون يفوزان بجائزة تورينج

بوابة ماسبيرو

٠٧-٠٣-٢٠٢٥

علوم
بوابة ماسبيرو

رائدا الذكاء الاصطناعى أندرو بارتو وريتشارد سوتون يفوزان بجائزة تورينج

حصل العالمان أندرو بارتو وريتشارد سوتون، الرائدان في مجال الذكاء الاصطناعي على جائزة تورينج المرموقة لهذا العام، والتي تُعرف غالبًا بـجائزة نوبل للحوسبة، وذلك تقديرًا لعملهما الرائد في التعلم التعزيزي. تُمنح هذه الجائزة من قبل جمعية آلات الحوسبة (ACM) وتأتي مع مكافأة مالية قدرها مليون دولار. والتعلم التعزيزي هو تقنية في مجال تعلم الآلة تمكّن الأنظمة من التعلم واتخاذ القرارات من خلال التجربة والخطأ، وهو النهج الذي اعتمد عليه بارتو وسوتون في أبحاثهما منذ أواخر السبعينيات. وكانت هذه التقنية أساسية في تطوير أنظمة ذكاء اصطناعي متقدمة، مثل نظام AlphaGo من جوجل، الذي هزم أبطال البشر في لعبة الـGo، وتُستخدم أيضًا في نماذج اللغة الكبيرة مثل ChatGPT.

أحدث الأخبار مع #أندروبارتو

«المتعة والألم».. سر نجاح الـ AI

رائدا الذكاء الاصطناعى أندرو بارتو وريتشارد سوتون يفوزان بجائزة تورينج

حمّل التطبيق الآن وابدأ باستخدامه الآن