解锁大规模语言模型中思维链提示的潜力

引言
理解思维链提示
思维链提示的优势
思维链提示的类型
Auto-CoT 实现
思维链提示的应用
局限性与未来方向
结论

在我们的博客中，探索思维链（CoT）提示如何从算术推理到常识与符号推理等多个领域增强大型语言模型（LLM）的能力。

引言

大型语言模型（LLM）已经彻底改变了人工智能的格局，在理解和生成自然语言方面提供了无与伦比的能力。尽管如此，它们在执行复杂推理任务方面的熟练程度一直是广泛研究的焦点。在这一领域展现出潜力的一种方法是思维链（CoT）提示。本文深入探讨了 CoT 提示的细节及其对 LLM 未来轨迹的影响。

正如近期一篇论文所概述的，CoT 提示是一种旨在促使 LLM 阐明其推理过程的策略。这需要向模型提供一组示例，其中推理路径以少样本的方式被明确描绘。期望 LLM 在响应提示时模仿类似的推理轨迹。这种方法已被证明在需要复杂推理的任务中显著提升了模型的效能。

CoT 提示的一个主要优势在于它能够提升 LLM 在涉及算术、常识和符号推理任务中的表现。研究表明，特别是在拥有约 1000 亿参数的模型中，性能有了显著提升。相比之下，较小的模型则倾向于生成不合逻辑的思维链，导致与传统的提示技术相比准确性降低。

理解思维链提示

本质上，CoT 提示指的是指导 LLM 进行逐步思考。这需要向模型提供一个描绘推理过程的少样本示例。然后，模型在制定对提示的响应时，被要求遵循类似的思维链。这种方法在需要一系列推理步骤才能生成响应的复杂任务中尤为有效。

以下是一个利用少样本策略的 CoT 提示示例：

这是大型语言模型（由 novita.ai 提供）的回答方式：

CoT 提示也可以扩展到零样本场景。在这种情况下，它涉及在初始提示中添加诸如“让我们一步步来解决”之类的短语，这可以补充少样本提示。这种小的补充已被证明在提示本身缺乏足够示例的任务中能够有效提升模型的效能。

手动 CoT 的挑战

尽管手动 CoT 取得了显著成就，但手动创建演示仍然存在障碍。不同的任务需要不同的演示，而设计有效的演示可能需要相当大的努力。为了克服这一挑战，研究人员提出了一种自动化的 CoT 提示方法，称为 Auto-CoT。该方法利用带有“让我们一步步来解决”提示的 LLM 来自动生成演示的推理链。

多样性在 Auto-CoT 中的作用

研究中一个关键的发现强调了在自动构建演示中多样性的重要性。研究人员观察到，自动生成的推理链经常包含错误。为了减轻这些错误的影响，他们引入了一种名为 Auto-CoT 的自动化 CoT 提示技术。Auto-CoT 选择具有不同属性的问题，并生成推理链来构建演示。通过利用多样性，Auto-CoT 致力于提高自动构建演示的质量。

思维链提示的优势

使用思维链（CoT）提示与大型语言模型（LLM）结合带来了许多优势，促进了更有效和高效的交互。以下是主要优势：

提高精度：CoT 提示通过一系列提示引导模型，显著增加了获得准确和相关响应的可能性。这种结构化的方法有助于完善模型的理解，从而得到更精确的输出。
增强控制：链为与 LLM 的交互提供了一个结构化框架，使用户能够更好地控制模型的输出。通过遵循一系列提示，用户可以引导对话朝着预期的方向进行，减少了意外或不相关结果的风险。
一致的上下文保持：链内的自适应学习确保了整个对话过程中上下文的一致保留。这种上下文的保留促进了更连贯和有意义的交互，因为模型会保持对当前对话的记忆。
效率：CoT 提示简化了交互过程，省去了多次输入的需要，从而节省了时间。用户能够更高效地实现特定结果，尤其是在针对 LLM 提示的特定输出时。
增强推理能力：CoT 提示鼓励 LLM 专注于一步步解决问题，而不是同时考虑整个挑战。这种方法增强了 LLM 的推理能力，促进了更系统化和实用的问题解决过程。

思维链提示的类型

在思维链（CoT）提示领域中，出现了两种有效的策略，它们都对增强与大型语言模型（LLM）的交互至关重要。现在，让我们探讨这些方法的细节：

多模态 CoT

多模态 CoT 提示通过集成多种输入模式（包括图像、音频或视频）为传统的文本交互注入了动态元素。

用户通过提供一个多模态提示来启动链，为 LLM 呈现一个更复杂的上下文以供解释和处理。后续提示可以进一步融入多种模态，促进对用户输入的更深层次理解。多种模态的加入增强了上下文，使模型能够更好地把握用户意图的细微差别。多模态输入可以引发 LLM 更具想象力的响应，扩展生成多样化和上下文相关内容的范围。

如果您想了解更多关于多模态语言模型的信息，可以查看我们的博客：大型多模态模型（LMM）：AI 世界的巨大飞跃

最小到最多提示

最小到最多提示是一种策略，以极简的提示开始链，并在后续提示中逐步增加复杂性。交互从一个基础而宽泛的提示开始，使模型能够提供初步响应。随着链的展开，用户可以逐渐引入更多细节、规格或复杂性，将模型引导向更细致和精确的输出。这种递增的方法促进了模型理解的逐步增强，降低了交互初期误解的风险。

最小到最多提示使用户能够根据模型的初始响应调整任务的复杂性，确保更个性化和实用的交互。

Auto-CoT 实现

Auto-CoT 涉及两个主要步骤：

将给定数据集中的问题分割成八个聚类 —— 使用 sentence-BERT 对问题进行编码，然后根据余弦相似度建立聚类。
从每个聚类中选择一个代表性问题，并使用零样本 CoT 配合简单的启发式方法构建其推理链 —— 这些启发式方法包括避免选择超过 60 个 token 的问题或超过五个步骤的推理链。这些启发式方法旨在提高自动生成的响应准确的可能性。

思维链提示的应用

思维链（CoT）提示在多个领域都有应用，突显了其在增强大型语言模型（LLM）能力方面的多功能性。以下是几个值得注意的应用及示例：

算术推理

语言模型解决数学应用题的能力是众所周知的难题。通过与一个 5400 亿参数的语言模型集成，CoT 提示在 MultiArith 和 GSM8K 等基准测试中达到了相当或更优的性能。借助 CoT，模型能够有效处理算术推理任务，尤其在较大模型尺寸下表现出色。这一应用凸显了 CoT 提升数学问题解决能力的潜力。

常识推理

CoT 在增强语言模型常识推理能力方面的影响在此应用中得到体现。常识推理任务涉及基于一般知识理解物理和人类交互，对自然语言理解系统来说可能具有挑战性。CoT 提示在诸如 CommonsenseQA、StrategyQA、日期理解和体育理解等任务中表现有效。虽然模型大小通常会影响性能，但 CoT 带来了额外的增强，尤其是在体育理解任务中受益显著。

符号推理

符号推理任务常常给语言模型带来挑战，尤其是在使用标准提示方法时。然而，CoT 提示使 LLM 能够以令人印象深刻的解决率处理诸如最后一个字母连接和抛硬币等任务。它促进了符号推理，并有助于长度泛化，使模型能够在推理过程中处理更长的输入。这一应用凸显了 CoT 在增强模型执行复杂符号推理任务能力方面的巨大潜力。

问答（QA）

CoT 提示通过将复杂问题分解为逻辑步骤来增强问答能力。这种方法有助于模型理解问题的结构及其各元素之间的相互联系。CoT 促进了多跳推理，即模型迭代地收集和整合来自多个来源的信息。这一迭代过程导致了更好的推理和更准确的答案。通过梳理推理步骤，CoT 还能减少响应中的常见错误和偏差。CoT 在问答中的应用凸显了其在解构复杂问题方面的有效性，从而促进了语言模型中更好的推理和理解。

局限性与未来方向

尽管 CoT 提示具有潜力，但它并非没有缺点。首先，它仅在约 1000 亿参数的模型中展现了性能提升。相反，较小的模型常常生成不合理的思维链，导致准确性低于传统提示方法。此外，从 CoT 提示中获得的效能提升通常与模型大小相关。

尽管存在这些局限性，CoT 提示标志着在增强 LLM 推理能力方面的一个显著进步。后续的研究工作可能会集中在完善这种方法，并探索在不同任务和模型维度上增强其有效性的途径。

结论

思维链（CoT）提示是人工智能领域的一项重大突破，特别是在增强大型语言模型（LLM）的推理能力方面。通过促使这些模型阐明其推理过程，CoT 在提升需要算术、常识和符号推理的复杂任务性能方面展现了潜力。尽管存在局限性，CoT 为 LLM 的未来发展带来了光明的前景。

随着我们不断推进 LLM 能力的新边界，像 CoT 提示这样的技术将变得不可或缺。通过培养逐步思考的方法并鼓励推理的解释，我们不仅能在复杂任务上提升模型性能，还能深入了解其内部机制。尽管实现完全推理的 LLM 之路依然漫长，但像 CoT 提示这样的方法论无疑让我们走上了正确的轨道。

novita.ai 是一个一站式的无限创意平台，为您提供 100 多个 API 接口。从图像生成、语言处理到音频增强和视频操作，采用廉价即用即付模式，让您在构建自己产品的同时免去 GPU 维护的麻烦。立即免费试用。

推荐阅读

LLM 和 GPT 有什么区别

LLM 排行榜 2024 预测揭秘

Novita AI LLM 推理引擎：最大吞吐量和最便宜推理

解锁大规模语言模型中思维链提示的潜力

引言