أحدث الأخبار مع #Claude35

سرايا الإخبارية
١٩-٠٢-٢٠٢٥
- صحة
- سرايا الإخبارية
هل يمكن للذكاء الاصطناعي أن يشيخ؟
سرايا - تُستخدم النماذج اللغوية الكبيرة (LLMs) وبرامج الدردشة الذكية بنحو متزايد في المجالات المختلفة لتبسيط التشخيصات الطبية، وتقديم الحلول البرمجية، والقيام بالعديد من المهام الأخرى. لكن هل يمكن لهذه القدرات أن تتراجع؟ وهل يمكن أن يشيخ الذكاء الاصطناعي ويواجه تدهورًا إدراكيًا تدريجيًا بمرور الزمن مثل الدماغ البشري؟ تجيب عن هذه الأسئلة دراسة حديثة سنوضح تفاصيلها فيما يلي: تفاصيل الدراسة: أظهرت دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024، أن بعض نماذج الذكاء الاصطناعي الرائدة تعاني تراجعًا في قدراتها الإدراكية، على نحو يشبه ظاهرة الشيخوخة البشرية. ووفقًا للباحثين، فإن هذا التدهور قد يُضعف كفاءة هذه النماذج في المهام الطبية التي تتطلب الدقة العالية، في وقت يزداد فيه الاعتماد على هذه التقنيات للمساعدة في تشخيص الأمراض المعقدة. كيف أُجريت الدراسة؟ اعتمد الباحثون في تقييمهم على اختبار مونتريال الإدراكي (MoCA) الذي يُستخدم عادةً للكشف عن علامات الضعف الإدراكي والخرف المبكر لدى كبار السن. وخضعت للاختبار بعض النماذج اللغوية الرائدة، وتشمل: GPT-4 و GPT-4o من OpenAI. Claude 3.5 من Anthropic. Gemini 1.0 و Gemini 1.5 من جوجل. وأظهرت النتائج أن الإصدارات القديمة من النماذج اللغوية كانت أقل كفاءة من الإصدارات الحديثة، وشبّه الباحثون هذا الأمر بما يحدث عند البشر؛ إذ تتراجع القدرات العقلية مع تقدم العمر. فقد سجلت النماذج القديمة درجات أقل من النماذج الحديثة، في نمط يشبه التراجع الإدراكي الناتج عن التنكس العصبي لدى الإنسان. ما اختبار MoCA؟ MoCA هو اختبار طبي يُستخدم للكشف المبكر عن الضعف الإدراكي والخرف. وقد أجرى الباحثون تغييرات في هذا الاختبار ليصبح مناسبًا لقياس أداء نماذج الذكاء الاصطناعي في عدة مجالات، منها: الانتباه، والذاكرة، واللغة، والمهارات البصرية المكانية، والوظائف التنفيذية. يُعد تسجيل 26 نقطة من أصل 30 مؤشرًا على السلامة الإدراكية لدى البشر. وفي نتائج الدراسة، حصل GPT-4o على 26 نقطة، وهو النموذج الوحيد الذي وصل إلى هذا الحد. وأما نموذج GPT-4 و Claude 3.5 فقد حصلا على نتيجة تبلغ 25 نقطة لكل منهما، وحقق Gemini 1.0 أدنى نتيجة وتبلغ 16 نقطة فقط. تفاصيل بعض الاختبارات أحد اختبارات الانتباه في MoCA يُطلب فيه من المرضى النقر عند سماعهم الحرف 'A' وسط سلسلة من الحروف. ولأن نماذج الذكاء الاصطناعي لا تمتلك حواسّ سمعية أو قدرات حركية، قُدّمت الحروف مكتوبة، وطُلب من النماذج تمييز الحرف 'A' بوضع علامة النجمة (*) أو طباعة كلمة (tap) بجانب الحرف. وتبيّن أن بعض النماذج نفذت المهمة تلقائيًا، واحتاجت نماذج أخرى إلى إرشادات أكثر تفصيلًا لفهم المطلوب. وبالاستناد إلى معايير MoCA، فإن أي نتيجة أقل من 26 نقطة تعني وجود ضعف إدراكي خفيف. كشفت الدراسة أيضًا أن جميع روبوتات الدردشة أظهرت أداءً ضعيفًا في المهام المُتعلقة بالمهارات البصرية المكانية والوظائف التنفيذية، مثل: اختبار تتبع المسار (الذي يتطلب ترتيب الأرقام والحروف تصاعديًا) واختبار رسم الساعة (الذي يتطلب رسم وجه ساعة يُظهر توقيتًا محددًا). كما لاحظ الباحثون عجز نماذج Gemini عن اجتياز اختبار التذكر المؤجل، الذي يُطلب فيه من النموذج تذكُّر قائمة مكونة من خمس كلمات. حصل GPT-4o على أعلى نتيجة، وهي 26 نقطة، وحصل كل من GPT-4 و Claude 3.5 على نتيجة تبلغ 25 نقطة. وسجل نموذج Gemini 1.0 أقل نتيجة وتبلغ 16 نقطة فقط، مما يشير إلى مستوى أعلى من التدهور الإدراكي مقارنةً بالنماذج الأخرى. وذكرت الدراسة أنه: 'لم يتمكن أي من النماذج التي خضعت للاختبار من الحصول على الدرجة الكاملة (30 نقطة)، وسجل معظمها نتائج أقل من الحد الأدنى (26 نقطة)، مما يشير إلى وجود ضعف إدراكي خفيف وربما علامات مبكرة للخرف'. وأشارت النتائج إلى أن الأعراض التي ظهرت على النماذج تشبه الأعراض التي تظهر لدى مرضى الضمور القشري الخلفي، وهو أحد أشكال مرض الزهايمر. وأشار الباحثون إلى أن هذه النتائج تتحدى الاعتقاد السائد بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين؛ إذ يمكن للقيود الإدراكية التي تعانيها النماذج المتقدمة أن تؤثر سلبًا في دقة التشخيصات الطبية، وتُضعف ثقة المرضى بها. الخاتمة حتى مع ما كشفته الدراسة من أوجه القصور الإدراكي لدى نماذج الذكاء الاصطناعي، فقد أشار الباحثون أيضًا إلى احتمالية تحسين أداء هذه النماذج في المهام الإدراكية والبصرية المكانية مستقبلًا مع استمرار تطور هذه التقنيات. ومع ذلك، أكدت الدراسة أن الفجوة الجوهرية بين الإدراك البشري والآلي من المرجح أن تظل موجودة بغض النظر عن التقدم الذي قد يحدث. وأكد الباحثون أن جميع المصطلحات المُستخدمة في الدراسة لوصف التدهور الإدراكي لدى نماذج الذكاء الاصطناعي قد استُخدمت مجازيًا فقط؛ إذ لا يمكن للبرامج الحاسوبية أن تُصاب بأمراض تنكسية عصبية كالتي تُصيب البشر.


البوابة العربية للأخبار التقنية
١٨-٠٢-٢٠٢٥
- صحة
- البوابة العربية للأخبار التقنية
هل يمكن للذكاء الاصطناعي أن يشيخ؟
تُستخدم النماذج اللغوية الكبيرة (LLMs) وبرامج الدردشة الذكية بنحو متزايد في المجالات المختلفة لتبسيط التشخيصات الطبية، وتقديم الحلول البرمجية، والقيام بالعديد من المهام الأخرى. لكن هل يمكن لهذه القدرات أن تتراجع؟ وهل يمكن أن يشيخ الذكاء الاصطناعي ويواجه تدهورًا إدراكيًا تدريجيًا بمرور الزمن مثل الدماغ البشري؟ تجيب عن هذه الأسئلة دراسة حديثة سنوضح تفاصيلها فيما يلي: تفاصيل الدراسة: أظهرت دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024، أن بعض نماذج الذكاء الاصطناعي الرائدة تعاني تراجعًا في قدراتها الإدراكية، على نحو يشبه ظاهرة الشيخوخة البشرية. ووفقًا للباحثين، فإن هذا التدهور قد يُضعف كفاءة هذه النماذج في المهام الطبية التي تتطلب الدقة العالية، في وقت يزداد فيه الاعتماد على هذه التقنيات للمساعدة في تشخيص الأمراض المعقدة. كيف أُجريت الدراسة؟ اعتمد الباحثون في تقييمهم على اختبار مونتريال الإدراكي (MoCA) الذي يُستخدم عادةً للكشف عن علامات الضعف الإدراكي والخرف المبكر لدى كبار السن. وخضعت للاختبار بعض النماذج اللغوية الرائدة، وتشمل: GPT-4 و GPT-4o من OpenAI. Claude 3.5 من Anthropic. Gemini 1.0 و Gemini 1.5 من جوجل. وأظهرت النتائج أن الإصدارات القديمة من النماذج اللغوية كانت أقل كفاءة من الإصدارات الحديثة، وشبّه الباحثون هذا الأمر بما يحدث عند البشر؛ إذ تتراجع القدرات العقلية مع تقدم العمر. فقد سجلت النماذج القديمة درجات أقل من النماذج الحديثة، في نمط يشبه التراجع الإدراكي الناتج عن التنكس العصبي لدى الإنسان. ما اختبار MoCA؟ MoCA هو اختبار طبي يُستخدم للكشف المبكر عن الضعف الإدراكي والخرف. وقد أجرى الباحثون تغييرات في هذا الاختبار ليصبح مناسبًا لقياس أداء نماذج الذكاء الاصطناعي في عدة مجالات، منها: الانتباه، والذاكرة، واللغة، والمهارات البصرية المكانية، والوظائف التنفيذية. يُعد تسجيل 26 نقطة من أصل 30 مؤشرًا على السلامة الإدراكية لدى البشر. وفي نتائج الدراسة، حصل GPT-4o على 26 نقطة، وهو النموذج الوحيد الذي وصل إلى هذا الحد. وأما نموذج GPT-4 و Claude 3.5 فقد حصلا على نتيجة تبلغ 25 نقطة لكل منهما، وحقق Gemini 1.0 أدنى نتيجة وتبلغ 16 نقطة فقط. تفاصيل بعض الاختبارات أحد اختبارات الانتباه في MoCA يُطلب فيه من المرضى النقر عند سماعهم الحرف 'A' وسط سلسلة من الحروف. ولأن نماذج الذكاء الاصطناعي لا تمتلك حواسّ سمعية أو قدرات حركية، قُدّمت الحروف مكتوبة، وطُلب من النماذج تمييز الحرف 'A' بوضع علامة النجمة (*) أو طباعة كلمة (tap) بجانب الحرف. وتبيّن أن بعض النماذج نفذت المهمة تلقائيًا، واحتاجت نماذج أخرى إلى إرشادات أكثر تفصيلًا لفهم المطلوب. وبالاستناد إلى معايير MoCA، فإن أي نتيجة أقل من 26 نقطة تعني وجود ضعف إدراكي خفيف. كشفت الدراسة أيضًا أن جميع روبوتات الدردشة أظهرت أداءً ضعيفًا في المهام المُتعلقة بالمهارات البصرية المكانية والوظائف التنفيذية، مثل: اختبار تتبع المسار (الذي يتطلب ترتيب الأرقام والحروف تصاعديًا) واختبار رسم الساعة (الذي يتطلب رسم وجه ساعة يُظهر توقيتًا محددًا). كما لاحظ الباحثون عجز نماذج Gemini عن اجتياز اختبار التذكر المؤجل، الذي يُطلب فيه من النموذج تذكُّر قائمة مكونة من خمس كلمات. حصل GPT-4o على أعلى نتيجة، وهي 26 نقطة، وحصل كل من GPT-4 و Claude 3.5 على نتيجة تبلغ 25 نقطة. وسجل نموذج Gemini 1.0 أقل نتيجة وتبلغ 16 نقطة فقط، مما يشير إلى مستوى أعلى من التدهور الإدراكي مقارنةً بالنماذج الأخرى. وذكرت الدراسة أنه: 'لم يتمكن أي من النماذج التي خضعت للاختبار من الحصول على الدرجة الكاملة (30 نقطة)، وسجل معظمها نتائج أقل من الحد الأدنى (26 نقطة)، مما يشير إلى وجود ضعف إدراكي خفيف وربما علامات مبكرة للخرف'. وأشارت النتائج إلى أن الأعراض التي ظهرت على النماذج تشبه الأعراض التي تظهر لدى مرضى الضمور القشري الخلفي، وهو أحد أشكال مرض الزهايمر. وأشار الباحثون إلى أن هذه النتائج تتحدى الاعتقاد السائد بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين؛ إذ يمكن للقيود الإدراكية التي تعانيها النماذج المتقدمة أن تؤثر سلبًا في دقة التشخيصات الطبية، وتُضعف ثقة المرضى بها. الخاتمة حتى مع ما كشفته الدراسة من أوجه القصور الإدراكي لدى نماذج الذكاء الاصطناعي، فقد أشار الباحثون أيضًا إلى احتمالية تحسين أداء هذه النماذج في المهام الإدراكية والبصرية المكانية مستقبلًا مع استمرار تطور هذه التقنيات. ومع ذلك، أكدت الدراسة أن الفجوة الجوهرية بين الإدراك البشري والآلي من المرجح أن تظل موجودة بغض النظر عن التقدم الذي قد يحدث. وأكد الباحثون أن جميع المصطلحات المُستخدمة في الدراسة لوصف التدهور الإدراكي لدى نماذج الذكاء الاصطناعي قد استُخدمت مجازيًا فقط؛ إذ لا يمكن للبرامج الحاسوبية أن تُصاب بأمراض تنكسية عصبية كالتي تُصيب البشر.


البوابة العربية للأخبار التقنية
١٨-٠٢-٢٠٢٥
- صحة
- البوابة العربية للأخبار التقنية
هل يمكن للذكاء الاصطناعي أن يشيخ؟ دراسة تكشف عن التراجع الإدراكي للنماذج اللغوية بمرور الوقت
تُستخدم النماذج اللغوية الكبيرة (LLMs) وبرامج الدردشة الذكية بنحو متزايد في المجالات المختلفة لتبسيط التشخيصات الطبية، وتقديم الحلول البرمجية، والقيام بالعديد من المهام الأخرى. لكن هل يمكن لهذه القدرات أن تتراجع؟ وهل يمكن أن يشيخ الذكاء الاصطناعي ويواجه تدهورًا إدراكيًا تدريجيًا بمرور الزمن مثل الدماغ البشري؟ تجيب عن هذه الأسئلة دراسة حديثة سنوضح تفاصيلها فيما يلي: تفاصيل الدراسة: أظهرت دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024، أن بعض نماذج الذكاء الاصطناعي الرائدة تعاني تراجعًا في قدراتها الإدراكية، على نحو يشبه ظاهرة الشيخوخة البشرية. ووفقًا للباحثين، فإن هذا التدهور قد يُضعف كفاءة هذه النماذج في المهام الطبية التي تتطلب الدقة العالية، في وقت يزداد فيه الاعتماد على هذه التقنيات للمساعدة في تشخيص الأمراض المعقدة. كيف أُجريت الدراسة؟ اعتمد الباحثون في تقييمهم على اختبار مونتريال الإدراكي (MoCA) الذي يُستخدم عادةً للكشف عن علامات الضعف الإدراكي والخرف المبكر لدى كبار السن. وخضعت للاختبار بعض النماذج اللغوية الرائدة، وتشمل: GPT-4 و GPT-4o من OpenAI. Claude 3.5 من Anthropic. Gemini 1.0 و Gemini 1.5 من جوجل. وأظهرت النتائج أن الإصدارات القديمة من النماذج اللغوية كانت أقل كفاءة من الإصدارات الحديثة، وشبّه الباحثون هذا الأمر بما يحدث عند البشر؛ إذ تتراجع القدرات العقلية مع تقدم العمر. فقد سجلت النماذج القديمة درجات أقل من النماذج الحديثة، في نمط يشبه التراجع الإدراكي الناتج عن التنكس العصبي لدى الإنسان. ما اختبار MoCA؟ MoCA هو اختبار طبي يُستخدم للكشف المبكر عن الضعف الإدراكي والخرف. وقد أجرى الباحثون تغييرات في هذا الاختبار ليصبح مناسبًا لقياس أداء نماذج الذكاء الاصطناعي في عدة مجالات، منها: الانتباه، والذاكرة، واللغة، والمهارات البصرية المكانية، والوظائف التنفيذية. يُعد تسجيل 26 نقطة من أصل 30 مؤشرًا على السلامة الإدراكية لدى البشر. وفي نتائج الدراسة، حصل GPT-4o على 26 نقطة، وهو النموذج الوحيد الذي وصل إلى هذا الحد. وأما نموذج GPT-4 و Claude 3.5 فقد حصلا على نتيجة تبلغ 25 نقطة لكل منهما، وحقق Gemini 1.0 أدنى نتيجة وتبلغ 16 نقطة فقط. تفاصيل بعض الاختبارات أحد اختبارات الانتباه في MoCA يُطلب فيه من المرضى النقر عند سماعهم الحرف 'A' وسط سلسلة من الحروف. ولأن نماذج الذكاء الاصطناعي لا تمتلك حواسًا سمعية أو قدرات حركية، قُدّمت الحروف مكتوبة، وطُلب من النماذج تمييز الحرف 'A' بوضع علامة النجمة (*) أو طباعة كلمة (tap) بجانب الحرف. وتبيّن أن بعض النماذج نفذت المهمة تلقائيًا، واحتاجت نماذج أخرى إلى إرشادات أكثر تفصيلًا لفهم المطلوب. وبالاستناد إلى معايير MoCA، فإن أي نتيجة أقل من 26 نقطة تعني وجود ضعف إدراكي خفيف. كشفت الدراسة أيضًا أن جميع روبوتات الدردشة أظهرت أداءً ضعيفًا في المهام المُتعلقة بالمهارات البصرية المكانية والوظائف التنفيذية، مثل: اختبار تتبع المسار (الذي يتطلب ترتيب الأرقام والحروف تصاعديًا) واختبار رسم الساعة (الذي يتطلب رسم وجه ساعة يُظهر توقيتًا محددًا). كما لاحظ الباحثون عجز نماذج Gemini عن اجتياز اختبار التذكر المؤجل، الذي يُطلب فيه من النموذج تذكُّر قائمة مكونة من خمس كلمات. حصل GPT-4o على أعلى نتيجة، وهي 26 نقطة، وحصل كل من GPT-4 و Claude 3.5 على نتيجة تبلغ 25 نقطة. وسجل نموذج Gemini 1.0 أقل نتيجة وتبلغ 16 نقطة فقط، مما يشير إلى مستوى أعلى من التدهور الإدراكي مقارنةً بالنماذج الأخرى. وذكرت الدراسة: 'لم يتمكن أي من النماذج التي خضعت للاختبار من الحصول على الدرجة الكاملة (30 نقطة)، وسجل معظمها نتائج أقل من الحد الأدنى (26 نقطة)، مما يشير إلى وجود ضعف إدراكي خفيف وربما علامات مبكرة للخرف'. وأشارت النتائج إلى أن الأعراض التي ظهرت على النماذج تشبه الأعراض التي تظهر لدى مرضى الضمور القشري الخلفي، وهو أحد أشكال مرض الزهايمر. وأشار الباحثون إلى أن هذه النتائج تتحدى الاعتقاد السائد بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين؛ إذ يمكن للقيود الإدراكية التي تعانيها النماذج المتقدمة أن تؤثر سلبًا في دقة التشخيصات الطبية، وتُضعف ثقة المرضى بها. الخاتمة حتى مع ما كشفته الدراسة من أوجه القصور الإدراكي لدى نماذج الذكاء الاصطناعي، فقد أشار الباحثون أيضًا إلى احتمالية تحسين أداء هذه النماذج في المهام الإدراكية والبصرية المكانية مستقبلًا مع استمرار تطور هذه التقنيات. ومع ذلك، أكدت الدراسة أن الفجوة الجوهرية بين الإدراك البشري والآلي من المرجح أن تظل موجودة بغض النظر عن التقدم الذي قد يحدث. وأكد الباحثون أن جميع المصطلحات المُستخدمة في الدراسة لوصف التدهور الإدراكي لدى نماذج الذكاء الاصطناعي قد استُخدمت مجازيًا فقط؛ إذ لا يمكن للبرامج الحاسوبية أن تُصاب بأمراض تنكسية عصبية كالتي تُصيب البشر.


24 القاهرة
١٨-٠٢-٢٠٢٥
- علوم
- 24 القاهرة
Kimi AI.. الصين تطلق نموذج ذكاء اصطناعي جديد يتفوق على DeepSeek
أطلقت شركة Kimi AI نموذج Kimi 1.5 المجاني وغير المحدود لمنافسة GPT 4o وClaude 3.5، لتتحول الصين بسرعة إلى لاعب هائل في تطوير بعض النماذج الأكثر تقدمًا التي رأيناها حتى الآن. Kimi AI ووفقًا لـ techopedia، بعد أيام قليلة من تصدر DeepSeek R1 عناوين الأخبار، قدمت Moonshot AI نموذج Kimi AI 1.5، وهو نموذج تم الترويج له بالفعل باعتباره متفوقًا على GPT-4o من OpenAI وClaude 3.5 Sonnet من Anthropic. يُظهر هذا النموذج الجديد تقدمًا في التفكير المتعدد الوسائط، وفهم السياق الطويل، ومعالجة البيانات في الوقت الفعلي، مما يثير تساؤلات حول مستقبل هيمنة الذكاء الاصطناعي. ما هو كيمي AI؟ طورت شركة Moonshot AI، وهي شركة ناشئة مقرها بكين، روبوت المحادثة Kimi AI. وهو نموذج لغوي كبير (LLM) مصمم لفهم وتوليد استجابات نصية شبيهة بالإنسان، وخاصة باللغة الصينية. يمكن لأحدث أداة الذكاء الاصطناعي هذه التعامل مع ما يصل إلى 2 مليون حرف صيني في موجه واحد، مما يجعلها فعالة للغاية لتحليل المستندات الطويلة والتعامل مع المهام المعقدة. تعمل Moonshot AI على وضع Kimi كبديل فعال من حيث التكلفة وقوي للنماذج الرائدة القادمة من الولايات المتحدة، حيث تقوم ببنائها مقابل جزء بسيط من تكلفتها. ويتميز نموذج Kimi AI بالعديد من الميزات الفريدة، تتيح له قدراته المتعددة الوسائط معالجة النصوص والصور والرموز والتفكير فيها، وهذا يمنحه ميزة في المهام التي تتطلب تنسيقات متعددة، تمكنه معالجة السياق الموسعة من التعامل مع ما يصل إلى 128000 رمز في موجه واحد، والحفاظ على السياق خلال المحادثات الطويلة.