思维链CoT是什么

思维链(Chain-of-Thought, CoT)是一种引导大型语言模型(LLM)通过生成一系列中间推理步骤来解决复杂问题的技术。它的核心思想是模仿人类解决问题的过程，让AI不仅给出最终答案，还要“展示”其思考路径，从而将复杂的端到端推理任务分解为多个可验证的子步骤。

简单来说，思维链就是让AI“把思考过程说出来”。

传统模式：直接提问并期望得到答案。例如，问“小明有5个苹果，吃了2个，又买了3个，现在有几个？”，模型可能直接回答“6个”。
思维链模式：引导模型分步思考。模型会生成类似这样的过程：“小明最初有5个苹果。他吃了2个，所以剩下 5 – 2 = 3 个。然后他又买了3个，所以 3 + 3 = 6 个。最终答案是6个。”

这种显式的推理过程带来了两大好处：

思维链技术的发展历程，是一个从人工设计到自动化，再到模型内化的演进过程。

1. 开山之作：少样本思维链 (2022年初)

思维链的概念由谷歌大脑（Google Brain）的研究员 Jason Wei 等人于2022年1月在其里程碑论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中首次系统提出。

核心方法：少样本思维链（Few-shot CoT）。即在向模型提问时，预先提供几个包含完整推理步骤的问答示例。
惊人发现：这种方法能让大模型（通常指千亿参数级别以上）的推理能力“涌现”出来，在数学和常识推理等基准测试上的表现得到巨大提升。例如，在GSM8K数学数据集上，PaLM模型的准确率从17.9%飙升至58.1%。

同年，研究人员发现，无需提供复杂的示例，仅仅在问题前加上一句简单的触发语，也能激活模型的推理能力。

核心方法：零样本思维链（Zero-shot CoT）。最著名的触发语是 “Let’s think step by step.”（让我们一步一步地思考）。
意义：这种方法极大地降低了使用门槛，让思维链技术变得更加通用和易于普及，无需为每个任务手工编写示例。

为了进一步降低人工成本并提升效果，一系列增强技术应运而生。

自动思维链 (Auto-CoT)：旨在自动化构建少样本示例的过程。它通过对问题进行聚类，并自动生成代表性问题的推理链，从而减少了人工编写示例的巨大工作量。
自洽性 (Self-Consistency)：这是一种提升准确率的策略。它不再只生成一条推理路径，而是为同一个问题生成多条不同的思维链，然后通过投票选择出现频率最高的答案，从而显著提高结果的可靠性。

思维链技术持续演进，并与模型训练、多模态等领域深度融合。

与模型微调结合：从单纯的提示工程技术，发展为与模型微调（Fine-tuning）相结合，催生了原生就具备强大推理能力的新一代模型。
多模态思维链：将CoT的应用范围从纯文本扩展到包含图像的多模态任务，例如分析图表、解决视觉谜题等。
产业应用深化：截至2025年，思维链技术已在金融风控、电商客服、医疗诊断等具体场景中实现深度应用。同时，也出现了针对思维链结构进行优化的开源模型，以及允许用户通过指令（如 /think）动态控制模型推理深度的技术。