أحدث الأخبار مع #DeepSeekGRM


اليوم السابع
١٠-٠٤-٢٠٢٥
- أعمال
- اليوم السابع
DeepSeek تطور نماذج للذكاء الاصطناعي ذاتية التحسين
تسعى شركة DeepSeek إلى تقليل التدريب الذي تحتاجه نماذج الذكاء الاصطناعي لديها، سعيًا لخفض تكاليف التشغيل. وقد تعاونت الشركة الصينية الناشئة، التي أحدثت ضجة في الأسواق بنموذجها منخفض التكلفة للاستدلال الذي ظهر في يناير الماضي، مع باحثين من جامعة بكين في إعداد ورقة بحثية تُفصّل نهجاً جديداً للتعلم المُعزّز لجعل النماذج أكثر كفاءة. وكتب الباحثون أن الطريقة الجديدة تهدف إلى مساعدة نماذج الذكاء الاصطناعي على الالتزام بشكل أفضل بالتفضيلات البشرية من خلال تقديم مكافآت مقابل استجابات أكثر دقة وسهولة في الفهم. وقد أثبت التعلم المُعزّز فعاليته في تسريع مهام الذكاء الاصطناعي في تطبيقات ومجالات محدودة. ومع ذلك، فقد ثبت أن توسيعه ليشمل تطبيقات أكثر عمومية يُمثّل تحدياً - وهذه هي المشكلة التي يحاول فريق DeepSeek حلها من خلال ما يُطلق عليه "ضبط النقد الذاتي". وقد تفوقت هذه الاستراتيجية على الأساليب والنماذج الحالية في مختلف المعايير، وأظهرت النتيجة أداءً أفضل بموارد حوسبة أقل، وفقاً للورقة البحثية. وقد أعلنت شركة DeepSeek عن إطلاقها اسم DeepSeek-GRM على هذه النماذج الجديدة، وهو اختصار لعبارة "نمذجة المكافآت العامة"، وستصدرها مفتوحة المصدر. كما يتجه مطورو الذكاء الاصطناعي الآخرون، بما في ذلك عملاق التكنولوجيا الصيني Alibaba Group Holding، وشركة OpenAI التي تتخذ من سان فرانسيسكو مقراً لها، نحو آفاق جديدة لتحسين قدرات التفكير المنطقي والتحسين الذاتي أثناء أداء نموذج الذكاء الاصطناعي للمهام في الوقت الفعلي.


نافذة على العالم
٠٨-٠٤-٢٠٢٥
- أعمال
- نافذة على العالم
أخبار التكنولوجيا : DeepSeek تطور نماذج للذكاء الاصطناعي ذاتية التحسين
الثلاثاء 8 أبريل 2025 12:46 مساءً نافذة على العالم - تسعى شركة DeepSeek إلى تقليل التدريب الذي تحتاجه نماذج الذكاء الاصطناعي لديها، سعيًا لخفض تكاليف التشغيل. وقد تعاونت الشركة الصينية الناشئة، التي أحدثت ضجة في الأسواق بنموذجها منخفض التكلفة للاستدلال الذي ظهر في يناير الماضي، مع باحثين من جامعة بكين في إعداد ورقة بحثية تُفصّل نهجاً جديداً للتعلم المُعزّز لجعل النماذج أكثر كفاءة. وكتب الباحثون أن الطريقة الجديدة تهدف إلى مساعدة نماذج الذكاء الاصطناعي على الالتزام بشكل أفضل بالتفضيلات البشرية من خلال تقديم مكافآت مقابل استجابات أكثر دقة وسهولة في الفهم. وقد أثبت التعلم المُعزّز فعاليته في تسريع مهام الذكاء الاصطناعي في تطبيقات ومجالات محدودة. ومع ذلك، فقد ثبت أن توسيعه ليشمل تطبيقات أكثر عمومية يُمثّل تحدياً - وهذه هي المشكلة التي يحاول فريق DeepSeek حلها من خلال ما يُطلق عليه "ضبط النقد الذاتي". وقد تفوقت هذه الاستراتيجية على الأساليب والنماذج الحالية في مختلف المعايير، وأظهرت النتيجة أداءً أفضل بموارد حوسبة أقل، وفقاً للورقة البحثية. وقد أعلنت شركة DeepSeek عن إطلاقها اسم DeepSeek-GRM على هذه النماذج الجديدة، وهو اختصار لعبارة "نمذجة المكافآت العامة"، وستصدرها مفتوحة المصدر. كما يتجه مطورو الذكاء الاصطناعي الآخرون، بما في ذلك عملاق التكنولوجيا الصيني Alibaba Group Holding، وشركة OpenAI التي تتخذ من سان فرانسيسكو مقراً لها، نحو آفاق جديدة لتحسين قدرات التفكير المنطقي والتحسين الذاتي أثناء أداء نموذج الذكاء الاصطناعي للمهام في الوقت الفعلي.


اليوم السابع
٠٨-٠٤-٢٠٢٥
- أعمال
- اليوم السابع
DeepSeek تطور نماذج للذكاء الاصطناعي ذاتية التحسين
تسعى شركة DeepSeek إلى تقليل التدريب الذي تحتاجه نماذج الذكاء الاصطناعي لديها، سعيًا لخفض تكاليف التشغيل. وقد تعاونت الشركة الصينية الناشئة، التي أحدثت ضجة في الأسواق بنموذجها منخفض التكلفة للاستدلال الذي ظهر في يناير الماضي، مع باحثين من جامعة بكين في إعداد ورقة بحثية تُفصّل نهجاً جديداً للتعلم المُعزّز لجعل النماذج أكثر كفاءة. وكتب الباحثون أن الطريقة الجديدة تهدف إلى مساعدة نماذج الذكاء الاصطناعي على الالتزام بشكل أفضل بالتفضيلات البشرية من خلال تقديم مكافآت مقابل استجابات أكثر دقة وسهولة في الفهم. وقد أثبت التعلم المُعزّز فعاليته في تسريع مهام الذكاء الاصطناعي في تطبيقات ومجالات محدودة. ومع ذلك، فقد ثبت أن توسيعه ليشمل تطبيقات أكثر عمومية يُمثّل تحدياً - وهذه هي المشكلة التي يحاول فريق DeepSeek حلها من خلال ما يُطلق عليه "ضبط النقد الذاتي". وقد تفوقت هذه الاستراتيجية على الأساليب والنماذج الحالية في مختلف المعايير، وأظهرت النتيجة أداءً أفضل بموارد حوسبة أقل، وفقاً للورقة البحثية. وقد أعلنت شركة DeepSeek عن إطلاقها اسم DeepSeek-GRM على هذه النماذج الجديدة، وهو اختصار لعبارة "نمذجة المكافآت العامة"، وستصدرها مفتوحة المصدر. كما يتجه مطورو الذكاء الاصطناعي الآخرون، بما في ذلك عملاق التكنولوجيا الصيني Alibaba Group Holding، وشركة OpenAI التي تتخذ من سان فرانسيسكو مقراً لها، نحو آفاق جديدة لتحسين قدرات التفكير المنطقي والتحسين الذاتي أثناء أداء نموذج الذكاء الاصطناعي للمهام في الوقت الفعلي.

العربية
٠٨-٠٤-٢٠٢٥
- أعمال
- العربية
"ديب سيك" تطور نماذج ذكاء اصطناعي جديدة ذاتية التحسن
تتعاون شركة ديب سيك الصينية الناشئة مع جامعة تسينغهوا في بكين على تقليل التدريب الذي تحتاجه نماذج الذكاء الاصطناعي التي تطورها الشركة، سعيًا لخفض تكاليف التشغيل. وتعاونت الشركة الناشئة، التي أحدثت صدمة في الأسواق بنموذجها منخفض التكلفة للتفكير الذي ظهر في يناير، مع باحثين من الجامعة في إعداد ورقة بحثية تُفصّل نهجًا جديدًا للتعلم المُعزّز لجعل النماذج أكثر كفاءة. ووفقًا للورقة البحثية، تهدف الطريقة الجديدة إلى مساعدة نماذج الذكاء الاصطناعي على الالتزام بشكل أفضل بالتفضيلات البشرية من خلال تقديم مكافآت مقابل استجابات أكثر دقة وسهولة في الفهم، بحسب تقرير لوكالة بلومبرغ، اطلعت عليه "العربية Business". وقد أثبت التعلم المُعزّز فعاليته في تسريع مهام الذكاء الاصطناعي في تطبيقات ومجالات محدودة. ومع ذلك، فقد ثبت أن توسيعه ليشمل تطبيقات عمومية أكثر يُمثّل تحديًا، وهذه هي المشكلة التي يحاول فريق "ديب سيك" حلها من خلال ما يُطلق عليه "self-principled critique tuning" أي "الضبط النقدي الذاتي المبدئي". وقد تفوقت هذه الاستراتيجية على الأساليب والنماذج الحالية في مختلف المعايير، وأظهرت النتيجة أداءً أفضل بموارد حوسبة أقل، وفقًا لما جاء في الورقة البحثية. وأطلقت "ديب سيك" على هذه النماذج الجديدة اسم "DeepSeek-GRM"، وهو اختصار لعبارة "نمذجة المكافآت العامة"، وستطلقها في شكل مفتوح المصدر، وفقًا لما ذكرته الشركة. ويتجه مطورو الذكاء الاصطناعي الآخرون، بما في ذلك عملاق التكنولوجيا الصيني مجموعة علي بابا وشركة "OpenAI" ومقرها سان فرانسيسكو، نحو آفاق جديدة لتحسين قدرات التفكير والتحسين الذاتي أثناء أداء نموذج الذكاء الاصطناعي للمهام في الوقت الآني. وأصدرت شركة ميتا، ومقرها مينلو بارك بولاية كاليفورنيا، أحدث سلسلة من نماذج الذكاء الاصطناعي، "Llama 4"، خلال عطلة نهاية الأسبوع، واعتبرتها أول نماذجها التي تستخدم تقنية مزيج الخبراء (MoE). وتعتمد نماذج "ديب سيك" بشكل كبير على تقنية مزيج الخبراء لزيادة كفاءة استخدام الموارد، وقد أجرت "ميتا" مقارنة بين إصدارها الجديد والشركة الناشئة ومقرها هانغتشو. ولم تحدد "ديب سيك" موعد إصدار نموذجها الرائد التالي.


الشرق السعودية
٠٨-٠٤-٢٠٢٥
- علوم
- الشرق السعودية
DeepSeek تكشف عن تقنية "ثورية" لتشغيل نموذجها القادم R3 للاستدلال
أعلنت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن اعتماد نهج مبتكر يهدف إلى تحسين قدرات الاستدلال لدى النماذج اللغوية الكبيرة (LLMs)، وذلك في وقت يتزايد فيه الترقب لإصدار الجيل التالي من نماذج الشركة. وكشفت الشركة بالتعاون مع باحثين من جامعة تسينغهوا الصينية، عن تقنية جديدة تعتمد على منهجيتين مبتكرتين أطلقت عليهما "نمذجة المكافآت التوليدية" (Generative Reward Modelling - GRM)، و"ضبط التقييم الذاتي المرتكز إلى المبادئ الذاتية" (Self-principled Critique Tuning)، بحسب ما جاء في ورقة بحثية نُشرت الجمعة، على منصة arXiv المتخصصة في الأبحاث العلمية. وتهدف هذه المنهجية المزدوجة إلى تمكين النماذج اللغوية الكبيرة (LLMs)، من تقديم نتائج أكثر دقة وبوتيرة أسرع عند التعامل مع الأسئلة العامة. أسلوب المكافآت تعد نمذجة المكافآت التوليدية (Generative Reward Modeling - GRM)، طريقة لتعليم نموذج الذكاء الاصطناعي كيف يُفضّل البشر أن تكون الإجابات. وبدلاً من أن يُقيّم الإنسان كل إجابة يعطيها النموذج، تُستخدم GRM لتدريب نموذج آخر يمكنه القيام بهذه المهمة بشكل تلقائي. هذا النموذج "الذكي" يتعلم كيف يقيّم الإجابات، ويمنحها "مكافآت" وفقاً لمدى جودتها وقربها من التفضيلات البشرية. وتشبه الفكرة لعبة يحصل فيها الذكاء الاصطناعي على نقاط عندما يُعطي إجابات جيدة، ويفقد نقاطاً عندما يُخطئ. وبمرور الوقت، يتعلم النموذج كيف يجيب بشكل أفضل لينال أعلى قدر ممكن من المكافآت، ما يؤدي إلى تحسين قدراته الاستدلالية وتقديمه لإجابات أكثر دقة ومواءمة لما يتوقعه المستخدم. وأكد الباحثون أن نماذج DeepSeek-GRM الجديدة تفوقت على الطرق المعتمدة حالياً، بعدما "حققت أداءً تنافسياً" مقارنة بنماذج المكافآت العامة ذات الأداء القوي. جيل جديد وأوضح الفريق أن تقنية "نمذجة المكافآت Award Modelling" تُعد من الأساليب المستخدمة لتوجيه النماذج اللغوية نحو تفضيلات البشر، وهي بذلك تُسهم في تعزيز جودة الاستجابات. كما أشار الباحثون إلى أن الشركة تخطط لإتاحة نماذج GRM مفتوحة المصدر، لكنها لم تحدد موعداً زمنياً لذلك حتى الآن. وجاءت هذه الورقة البحثية في ظل تزايد التكهنات بشأن الخطوة التالية لشركة DeepSeek، خاصة بعد أن نالت اهتماماً عالمياً واسعاً بفضل نموذجها الأساسي V3 ونموذج الاستدلال R1. وكانت وكالة "رويترز" قد ذكرت في تقرير لها الشهر الماضي، أن الإصدار القادم، DeepSeek-R2، قد يُطرح في الأسواق خلال وقت مبكر من شهر أبريل الجاري، في إطار سعي الشركة للاستفادة من شعبيتها المتصاعدة. وسرعان ما أثار التقرير حالة من الترقب في الأوساط التقنية العالمية، خاصة بعد أن أحدث نموذج DeepSeek-R1 ضجة واسعة لما قدّمه من أداء فعّال بتكلفة منخفضة، وهو ما جعله منافساً بارزاً لأقوى النماذج الموجودة حالياً. لكن الشركة حافظت على صمتها إزاء التقارير التي تحدثت عن قرب إصدار R2، ولم تُصدر أي تعليق عبر قنواتها الرسمية. وفي المقابل، أفادت وسائل إعلام صينية بأن حساب خدمة العملاء التابع لـ DeepSeek، نفى صحة هذه المعلومات ضمن مجموعة محادثة خاصة مع عملاء تجاريين. وكانت الشركة قد أجرت في مارس الماضي، تحديثاً رئيسياً على نموذج V3 الخاص بها، إذ أطلقت الإصدار "DeepSeek-V3-0324"، والذي قالت إنه يقدّم "قدرات استدلال مُعزّزة، وتحسينات في تطوير الواجهات الأمامية لمواقع الإنترنت، فضلاً عن تعزيز كفاءة الكتابة باللغة الصينية". وفي فبراير الماضي، فتحت الشركة 5 من مستودعاتها البرمجية لتكون مفتوحة المصدر، ما أتاح للمطورين حول العالم مراجعة الشيفرات البرمجية والمساهمة في تطويرها، مؤكدة في بيانها التزامها بـ"تحقيق تقدم حقيقي بشفافية كاملة".