思维链CoT

张开发
2026/4/8 15:38:50 15 分钟阅读

分享文章

思维链CoT
思维链Chain-of-Thought, CoT是一种让大语言模型LLM“把思考过程说出来”的技术。它通过引导模型生成中间推理步骤显著提升了在复杂问题上的表现。运作机制从“猜答案”到“推答案”普通提示直接输出输入Q: 教室里原来有 3 个人出去 2 个又进来 4 个现在有几人输出A: 5模型可能凭直觉瞎猜CoT 提示展示推理输入Q: ... 现在有几人 Lets think step by step.输出首先3 - 2 1 人。然后1 4 5 人。所以答案是 5。为什么有效对齐人类思维模仿了人类解决复杂问题时的“工作记忆”过程将问题分解为可管理的子步骤。减少幻觉暴露推理路径让错误更容易被追溯和修正例如发现是减法算错了而不是逻辑错了。解锁涌现能力对于超大模型如 100B 参数CoT 能激发出单纯问答模式下不具备的数学和逻辑推理能力。主要技术变体Few-Shot CoT少样本在提问前先给模型看几个“问题 推理步骤 答案”的例子让它学会模仿这种格式。Zero-Shot CoT零样本直接使用触发词如 Lets think step by step引导模型开始推理无需示例。Self-Consistency自洽性让模型生成多条不同的推理路径然后通过“投票”选出最一致的答案提高可靠性。典型应用场景数学计算多步骤的算术或应用题。逻辑推理判断因果关系、解决谜题。复杂规划制定计划、分析利弊。局限性计算成本生成的 Token 变多推理速度变慢。伪推理模型可能生成看似合理、实则错误的“编造步骤”。小模型无效参数较小的模型如 10B通常无法产生有效的 CoT 推理反而可能因输出变长而增加错误。该技术由 Jason Wei 等人在 2022 年提出现已成为大模型解决复杂任务的标配技术。

更多文章