لماذا يعد “شات جي بي تي” سيئا جدا في الرياضيات؟

إذا جربت يوما استخدام “شات جي بي تي” كآلة حاسبة، فمن المؤكد أنك لاحظت عجزه في الرياضيات. فروبوت الدردشة سيئ في الحساب، وهذه ليست ميزة فريدة من نوعها بين أدوات الذكاء الاصطناعي.

فمن جهة أخرى، لا يستطيع “كلود” (Claude) من “أنثروبي” (Anthropic) حل مشكلات الكلمات البسيطة، ويفشل “جيميني” (Gemini) في فهم المعادلات التربيعية، ويواجه “لاما” (Llama) من “ميتا” (Meta) صعوبة في عملية جمع بسيطة. فكيف تتعثر هذه الروبوتات الذكية في حسابات رياضية بمستوى الصفوف الابتدائية؟

الجواب هو “عملية الترميز” حيث يساعد الذكاء الاصطناعي في ترميز المعلومات بكثافة من خلال عملية تجزئة البيانات إلى أجزاء (على سبيل المثال، تقسيم كلمة “جميل” إلى مقاطع “ج” “م” “ي” “ل”). ولأن أدوات التجزئة في النماذج الذكية لا تعرف ما هي الأرقام، فغالبا ما تنتهي بتخريب العلاقات بينها.

فعلى سبيل المثال، قد تعالج أداة التجزئة الرقم “380” على أنه عنصر واحد، ولكنها تفهم العدد “381” على أنه زوج من الأرقام (“38” و “1”)، وهنا يحدث الخطأ.

ولكن عملية الترميز ليست السبب الوحيد في ضعف الذكاء الاصطناعي في الرياضيات. فأنظمة الذكاء الاصطناعي عبارة عن آلات إحصائية، وبعد تدريبها على العديد من الأمثلة تتعلم أنماط تلك الأمثلة لتقديم التوقعات.

وفي أحد الأمثلة، عند سؤال “شات جي بي تي” عن مسألة ضرب مثل 5,7897 × 1,2832، من المحتمل أن يستنتج النموذج أن حاصل ضرب رقم ينتهي بـ”7″ ورقم ينتهي بـ”2″ سينتهي بـ”4″. وذلك بالاعتماد على الأخطاء في عمليات ضرب واجهها سابقا وتعلم منها.

ولكنه سيواجه صعوبة في الجزء الأوسط، وسيعطي الجواب على أنه 742,021,104 بينما الجواب الصحيح هو 742,934,304.

وقام يونتيان دينغ، الأستاذ المساعد في جامعة واترلو والمتخصص في الذكاء الاصطناعي، بتقييم شامل لقدرات الضرب في “شات جي بي تي” في دراسة أجراها هذا العام.

وقد وجد هو وزملاؤه أن النموذج الافتراضي “جي بي تي -4 أو” (GPT-4o) واجه صعوبة في ضرب أعداد مكونة من أكثر من 4 أرقام مثل 3,459 × 5,284.

وقال دينغ إن “جي بي تي -4 أو” يواجه صعوبة في ضرب الأرقام المتعددة، إذ يحقق دقة أقل من 30% في ضرب أعداد مكونة من 4 أرقام. وأضاف أن عمليات حسابية كهذه “تُشكل تحديا لنماذج اللغة لأن أي خطأ في أي خطوة تالية يمكن أن يتراكم، ومن ثم يؤدي إلى نتيجة نهائية غير صحيحة”.

ومن جهة أخرى، يشعر دينغ بالتفاؤل. ففي الدراسة أجراها هو وزملاؤه على نموذج “أو1” (o1)، وهو نموذج “الاستدلال” الخاص بشركة “أوبن إيه آي”، حقق النموذج نتائج أفضل بكثير من “جي بي تي -4 أو”، حيث تمكن من حل عمليات ضرب أعداد مكونة من 9 أرقام بشكل صحيح في نصف الوقت تقريبا.

وأضاف “قد يحل النموذج عملية الضرب بطرق تختلف عن الطرق التي نحلها يدويا، وهذا يثير فضولنا حول نهج النموذج في حل المسائل وكيف يختلف عن الاستدلال البشري”.