ما هو الاستدلال التراكمي مع نماذج اللغة الكبيرة؟

مقدمة

ما هو الاستدلال التراكمي مع نماذج اللغة الكبيرة؟ لماذا نحتاج إلى الاستدلال التراكمي لنماذج اللغة الكبيرة؟ كيف يبدو الاستدلال التراكمي مع نماذج اللغة الكبيرة؟ هل يمكن لنماذج اللغة الكبيرة أداء الاستدلال التراكمي بشكل جيد؟ في هذه المدونة، سنناقش هذه الأسئلة واحدة تلو الأخرى بطريقة بسيطة وواضحة، بالاستناد إلى الورقة البحثية بعنوان “الاستدلال التراكمي مع نماذج اللغة الكبيرة” من تأليف Yifan Zhang و Jingqin Yang و Yang Yuan و Andrew Chi-Chih Yao.

ما هو الاستدلال التراكمي؟

الفكرة الأساسية وراء إطار الاستدلال التراكمي هي تقسيم مشكلات التفكير المعقدة إلى خطوات أصغر، ثم بناء الحل النهائي بشكل متكرر عن طريق تراكم والتحقق من كل خطوة وسيطة.

يتيح الاستدلال التراكمي التخزين الديناميكي وتجميع الفرضيات الوسيطة المُتحقق منها، مما يشكل رسمًا بيانيًا موجهًا غير دوري (DAG).

بالتحديد، في إطار الاستدلال التراكمي:

يقترح المقترح خطوات تفكير محتملة بناءً على السياق الحالي، والتي تُعرض كعقد جديدة في الرسم البياني الموجه غير الدوري.
يقوم المدقق (المدققون) بتقييم ما إذا كانت اقتراحات المقترح صحيحة ويدرج الخطوات الصالحة في سياق الحل المتطور، وهو ما يتوافق مع إضافة حواف موجهة جديدة إلى الرسم البياني.
يحدد المراسل ما إذا كان السياق المتراكم قد وصل إلى حل نهائي بناءً على الحالة الحالية. إذا كان الأمر كذلك، فإنه يُخرج النتيجة.

وبالتالي، يمكن تمثيل عملية التفكير بأكملها كرسم بياني موجه غير دوري يتم بناؤه ديناميكيًا، حيث تكون العقد هي خطوات التفكير الوسيطة، والحواف الموجهة تلتقط كيفية اشتقاق خطوات التفكير الجديدة من الخطوات السابقة. يسمح الرسم البياني الموجه غير الدوري لعملية التفكير بالتفرع وإعادة التقاء، ويمكن من إعادة زيارة وإعادة استخدام نتائج التفكير السابقة، مما يعكس بشكل أفضل عملية التفكير متعددة المسارات المرنة لدى البشر في حل المشكلات المعقدة.

لماذا نحتاج إلى الاستدلال التراكمي لنماذج اللغة الكبيرة؟

على الرغم من التقدم الحديث لنماذج اللغة الكبيرة في تطبيقات متنوعة، إلا أن قدرتها على حل مشكلات التفكير المعقدة متعددة الخطوات لا تزال محدودة. الأساليب الحالية مثل سلسلة الأفكار (CoT) وشجرة الأفكار (ToT)، على الرغم من محاولتها توجيه نماذج اللغة الكبيرة خلال عملية تفكير خطوة بخطوة أكثر تنظيماً، إلا أنها تفتقر إلى آليات ديناميكية لتخزين والاستفادة من النتائج الوسيطة المُنتجة أثناء عملية التفكير. هذا العجز عن البناء بشكل فعال على الفرضيات السابقة وتجميعها يحد من أدائها في المشكلات المعقدة متعددة الجوانب التي تتطلب تفكيرًا دقيقًا عبر خطوات متعددة.

باستلهام من العمليات الإدراكية البشرية، يقدم الاستدلال التراكمي أدوارًا متخصصة مثل “المقترح” لاقتراح خطوات تفكير محتملة، و"المدققون" للتحقق من صحة المقترحات في سياقها، و"المُراسل" لتجميع النقاط المتراكمة في حل نهائي. هذا التحلل إلى دورات متكررة من الاقتراح والتحقق والإبلاغ يسمح لنماذج اللغة الكبيرة بتقسيم المهام المعقدة إلى مكونات قابلة للإدارة.

الأهم من ذلك، يتيح الاستدلال التراكمي التخزين الديناميكي وتجميع الفرضيات الوسيطة المُتحقق منها، مما يشكل رسمًا بيانيًا موجهًا غير دوري بدلاً من مجرد سلسلة خطية أو هيكل شجري. هذه المرونة الهيكلية للاستفادة من سياق أوسع من التحققيات السابقة تعكس التفكير المتعدد المسارات غير الخطي الذي يستخدمه البشر لمعالجة المشكلات المعقدة متعددة الخطوات. وبالتالي، يفتح الاستدلال التراكمي قدرات تفكير أكثر قوة وتنوعًا لنماذج اللغة الكبيرة.

كيف يبدو الاستدلال التراكمي مع نماذج اللغة الكبيرة؟

بناء أدوار نموذج اللغة

باستخدام إطار الاستدلال التراكمي، بنى المؤلفون ثلاثة أدوار لنموذج اللغة:

المقترح: يقترح خطوات تفكير محتملة بناءً على السياق الحالي
المدقق: يقيم اقتراحات المقترح من حيث الصحة ويدرج الخطوات الصالحة في السياق
المراسل: يحدد ما إذا كان السياق المتراكم يؤدي إلى حل نهائي

يمكن لهذه الأدوار الثلاثة استخدام نفس نموذج اللغة الكبير، مع مطالبات محددة لتعيين أدوار مختلفة.

إعداد الخطوط الأساسية

لتقييم فعالية الاستدلال التراكمي، قام المؤلفون بإعداد الخطوط الأساسية التالية:

المطالبة المباشرة بالإدخال والإخراج (مباشر)
مطالبة سلسلة الأفكار (CoT)
مطالبة سلسلة الأفكار المُتحقق منها ذاتيًا (CoT-SC)
مطالبة شجرة الأفكار (ToT)

اتباع إجراءات التجربة

اختبر المؤلفون نماذج لغة كبيرة متنوعة، بما في ذلك GPT-3.5 و GPT-4 و نماذج LLaMA. إجراءات التجربة هي كما يلي:

لكل مشكلة في مجموعة البيانات، أدخل المشكلة إلى المقترح
يولد المقترح سلسلة من اقتراحات التفكير كخطوات وسيطة
تُغذى الخطوات الوسيطة إلى المدقق، الذي يقيم كل خطوة
تُدرج الخطوات الصالحة في السياق، بينما تُهمل الخطوات غير الصالحة
كرر العملية أعلاه حتى يحدد المراسل أنه يمكن تقديم حل نهائي
في بعض التجارب، يُستخدم التصويت بالأغلبية أو استراتيجيات أخرى لتحسين المتانة

اختيار مجموعات بيانات التقييم

اختار المؤلفون مجموعات بيانات متعددة عبر أنواع مختلفة من مهام التفكير المعقدة للتقييم، بما في ذلك:

مهام الاستدلال المنطقي: مجموعة بيانات FOLIO wiki، مجموعة بيانات AutoTNLI
لغز الرياضيات “لعبة الـ 24”
حل المسائل الرياضية: مجموعة بيانات MATH

هل يمكن لنماذج اللغة الكبيرة أداء الاستدلال التراكمي بشكل جيد؟

الإجابة البسيطة هي: نعم! تُظهر النتائج التجريبية أن إطار الاستدلال التراكمي يتفوق بشكل كبير على الأساليب الأساسية في جميع المهام المُقيمة.

الأداء العام

في مجموعة بيانات FOLIO wiki، تحسنت الدقة من 85.02% إلى 98.04%؛ في مجموعة بيانات AutoTNLI، أظهرت تحسنًا نسبيًا يصل إلى 9.3% مقارنة بسلسلة الأفكار؛ في لعبة الـ 24، حققت دقة 98%، مما يمثل تحسنًا بنسبة 24% عن أفضل طريقة سابقة؛ في مجموعة بيانات MATH، حصل الاستدلال التراكمي على تحسن مطلق بنسبة 4.2% وتحسن نسبي بنسبة 43% في أصعب مشكلات المستوى 5. وبشكل ملحوظ، من خلال دمج الاستدلال التراكمي مع بيئة برمجية، حقق المؤلفون دقة 72.2% في مجموعة بيانات MATH، متفوقين على الأفضل السابق بنسبة 38.8% نسبيًا.

التفوق على سلسلة الأفكار (CoT) وشجرة الأفكار (ToT)

يُظهر الاستدلال التراكمي تفوقه على سلسلة الأفكار وشجرة الأفكار من خلال سلسلة من النتائج التجريبية عبر مهام متنوعة. في مهام الاستدلال المنطقي باستخدام مجموعات بيانات مثل FOLIO wiki و AutoTNLI، أظهر الاستدلال التراكمي أداءً رائعًا، حيث حقق معدل دقة 98.04% على مجموعة بيانات FOLIO المُنظمة، وهي قفزة ملحوظة من 96.09% لـ CoT-SC. يُعزى هذا التقدم إلى قدرة الاستدلال التراكمي على تخزين النتائج الوسيطة والاستفادة منها ديناميكيًا، مما يشكل رسمًا بيانيًا موجهًا غير دوري يسمح بسياق أوسع من الفرضيات المُتحقق منها.

في لعبة الـ 24، وهو لغز رياضي، تفوق الاستدلال التراكمي بمعدل دقة 98%، محسنًا على شجرة الأفكار بنسبة 24% وباستخدام ربع الحالات المُزارة فقط، مما يؤكد كفاءته وقدرته على حل المشكلات.

علاوة على ذلك، في مجموعة بيانات MATH، لم يضع الاستدلال التراكمي معايير جديدة فقط بزيادة 4.2% عن الطرق السابقة، بل أظهر أيضًا تحسنًا نسبيًا بنسبة 43% في أصعب المشكلات. أدى دمج الاستدلال التراكمي مع بيئة Python البرمجية إلى دقة مذهلة بلغت 72.2%، متفوقًا على طرق مثل PoT و PAL بنسبة 38.8%. هذه النتائج مجتمعة توضح قابلية التكيف والمتانة وقدرات التفكير المحسنة للاستدلال التراكمي مقارنة بسلسلة الأفكار وشجرة الأفكار.

ما هي الاتجاهات المستقبلية للاستدلال التراكمي مع نماذج اللغة الكبيرة؟

التكامل مع الأنظمة الرمزية

يناقش المقال إمكانية دمج الاستدلال التراكمي مع بيئة Python البرمجية لتسخير قدرات الحوسبة والتفكير المنطقي لنماذج اللغة الكبيرة. يمكن للعمل المستقبلي استكشاف تكامل أعمق مع الأنظمة الرمزية أو الرسوم البيانية المعرفية أو مُثبتات النظريات الرسمية لتعزيز دقة التفكير وتعقيده.

تعزيز قدرات التعميم

بينما أظهر الاستدلال التراكمي نجاحًا في مجالات محددة، سيكون توسيع قدراته التعميمية إلى نطاق أوسع من المهام والمجالات أمرًا بالغ الأهمية. قد يشمل ذلك تكييف الاستدلال التراكمي للتعامل مع أنواع مختلفة من التفكير وحل المشكلات عبر تخصصات متنوعة.

زيادة المتانة وتحمل الأخطاء

يسلط المقال الضوء على الطبيعة المتسامحة للأخطاء في الاستدلال التراكمي. يمكن أن يركز العمل المستقبلي على جعل الاستدلال التراكمي أكثر متانة، خاصة في التعامل مع البيانات الغامضة أو المشوشة، وتحسين قدرته على التعافي من الخطوات الوسيطة غير الصحيحة.

وضع المعايير والتوحيد القياسي

تطوير معايير موحدة ومقاييس تقييم خاصة بمهام الاستدلال التراكمي يمكن أن يساعد في تقييم التقدم بشكل منهجي ومقارنة الأساليب المختلفة.

كيف يمكنني تنفيذ الاستدلال التراكمي مع نماذج اللغة الكبيرة؟

تتطلب معظم الأكواد التي قدمها المؤلفون اتصالاً بواجهة برمجة تطبيقات OpenAI لنماذج GPT 3.5 و 4، والتي يجب أن تكون خطوتك الأولى.

بعد ذلك، سواء كنت ترغب في حل مسائل رياضية أو لعب لعبة 24 أو تكرار تجارب الاستدلال التراكمي، فقط قم بتشغيل ملفات Python المحددة المتوفرة على صفحة Github هذه: https://github.com/iiis-ai/cumulative-reasoning.

بالإضافة إلى ذلك، إذا كنت ترغب في اختبار الاستدلال التراكمي مع نماذج LLaMA كما فعل المؤلفون في الورقة البحثية أو مع نماذج لغة كبيرة أخرى، يمكنك استخدام واجهة برمجة تطبيقات Novita AI LLM للوصول إلى نماذج لغة كبيرة متعددة.

الخاتمة

في الختام، قدمت مقالة المدونة نظرة شاملة عن الاستدلال التراكمي مع نماذج اللغة الكبيرة، وهو نهج جديد يعزز بشكل كبير قدرات حل المشكلات المعقدة لنماذج اللغة الكبيرة. من خلال تحليل المشكلات المعقدة إلى خطوات أصغر وبناء الحلول بشكل متكرر عبر عملية الاقتراح والتحقق والإبلاغ، يحاكي الاستدلال التراكمي الاستراتيجيات الإدراكية البشرية.

كانت النتائج من مجموعات البيانات المختلفة مثيرة للإعجاب، حيث أظهرت تحسينات كبيرة في الدقة، خاصة عند دمج الاستدلال التراكمي مع بيئة برمجية. علاوة على ذلك، أظهرت النتائج تفوق الاستدلال التراكمي على الأساليب الحالية مثل سلسلة الأفكار وشجرة الأفكار.

بشكل عام، تحمل الاتجاهات المستقبلية للاستدلال التراكمي مع نماذج اللغة الكبيرة إمكانية دفع نماذج اللغة الكبيرة إلى آفاق جديدة في التفكير الذكي، مما يؤدي إلى قدرات أكثر تطوراً وشبيهة بالبشر في حل المشكلات.

المراجع

Zhang, Y., Yang, J., Yuan, Y., & Yao, A. C.-C. (2024). Cumulative Reasoning with Large Language Models. IIIS, Tsinghua University. https://arxiv.org/pdf/2308.04371

Novita AI، المنصة الشاملة للإبداع اللامحدود التي تمنحك الوصول إلى أكثر من 100 واجهة برمجة تطبيقات. من توليد الصور ومعالجة اللغة إلى تحسين الصوت ومعالجة الفيديو، بنظام الدفع حسب الاستخدام الرخيص، فهي تحررك من متاعب صيانة وحدات معالجة الرسومات أثناء بناء منتجاتك الخاصة. جربها مجانًا.

ما هو الاستدلال التراكمي مع نماذج اللغة الكبيرة؟

مقدمة