LangChain ReAct 中文解析器实现 | 青雲的博客

背景与痛点

在用 LangChainJS 开发 Agent 时，ReAct（Reasoning and Acting）模式是最主流的推理与工具调用范式。它要求大模型输出结构化的推理链条，例如：

Thought: 我需要查找相关信息
Action: search
Action Input: 搜索内容
Observation: 搜索结果...
Final Answer: 基于搜索结果的回答

但实际开发中，发现 LangChain 原生的 ReActSingleInputOutputParser 只支持英文关键字，无法正确解析通义千问等中文大模型的输出。比如，模型输出“思考”、“动作”、“最终答案”等中文字段时，原生解析器会直接报错，导致 ReAct 推理链断裂，工具调用失败。

现有方案的不足

网上查阅资料后发现，LangChain 社区对中文模型的 ReAct 兼容性支持非常有限。大部分方案要么要求模型输出英文格式，要么只能降级为简单对话，无法实现完整的“思考-行动-观察-再思考-最终答案”推理链。

解决方案：QwenReActOutputParser

为了解决这个痛点，我开发了 langchain-react-chinese-parser，核心是自定义的 QwenReActOutputParser，专门为通义千问等中文大模型适配 ReAct 解析。

设计思路

中英文关键字兼容：支持“思考/动作/最终答案”等中英文混合关键字
格式容错：智能识别各种输出变体，提升解析鲁棒性
错误提示：解析失败时给出清晰的格式指导，提升开发体验
工程无侵入：无需修改 LangChain 核心代码，直接集成即可

核心架构

┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐
│ 用户输入 │───▶│ QwenReActAgent │───▶│ 工具执行 │
└─────────────────┘ └──────────────────┘ └─────────────────┘
│
▼
┌──────────────────┐
│ QwenReActOutput │
│ Parser │
└──────────────────┘

关键字映射

const KEYWORD_MAPPINGS = {
  thought: ['思考', '想法', 'thought', 'think'],
  action: ['动作', '行动', 'action', 'act'],
  actionInput: ['动作输入', '行动输入', 'action input', 'action_input'],
  finalAnswer: ['最终答案', '答案', 'final answer', 'answer'],
}

解析核心逻辑

export class QwenReActOutputParser extends BaseOutputParser<AgentAction | AgentFinish> {
  async parse(text: string): Promise<AgentAction | AgentFinish> {
    // 1. 预处理文本
    const cleanedText = this.preprocessText(text)

    // 2. 检查是否有最终答案
    if (this.containsFinalAnswer(cleanedText)) {
      return this.parseFinalAnswer(cleanedText)
    }

    // 3. 动作解析
    const actionMatch = this.parseAction(cleanedText)
    if (actionMatch) {
      return actionMatch
    }

    // 4. 错误处理
    throw new OutputParserException(
      `无法解析输出格式。请使用以下格式：
      思考: [你的思考过程]
      动作: [工具名称]
      动作输入: [工具参数]`
    )
  }
}

工程集成

好的，以下是参考 langchain-react-chinese-parser/README.md 的「工程集成」部分，结合你的项目背景，整理出的中文技术分享文章片段，可直接用于博客或社区发文：

工程集成

langchain-react-chinese-parser 的设计目标就是让工程集成变得极其简单，无论你是自定义 Agent 还是用官方 createReactAgent，都能一行代码切换为中文解析器，极大提升开发效率和兼容性。

方式一：自定义 Agent 类中集成（推荐）

如果你有自定义的 Agent 类，只需用我们的解析器替换原生解析器即可：

import { createQwenParser, createAutoParser } from 'langchain-react-chinese-parser'

export class QwenReActAgent {
  private parser

  constructor(options = {}) {
    // 替换为通义千问专用解析器
    this.parser = createQwenParser({ debug: true, relaxedMode: true })
    // 或者用自动识别解析器
    // this.parser = createAutoParser({ debug: true });
  }

  async invoke(input: string) {
    // ... 你的 Agent 逻辑 ...
    const rawOutput = await this.llm.invoke(prompt)

    try {
      // 用中文解析器解析输出
      const parsed = await this.parser.parse(rawOutput)

      if ('tool' in parsed) {
        // 工具调用
        return await this.executeTool(parsed)
      } else {
        // 最终答案
        return { output: parsed.returnValues.output }
      }
    } catch (error) {
      console.error('解析失败:', error.message)
      throw error
    }
  }
}

方式二：官方 createReactAgent + 自定义解析器

如果你用的是 LangChain 官方的 createReactAgent，可以这样集成：

import { AgentExecutor, createReactAgent } from 'langchain/agents'
import { pull } from 'langchain/hub'
import { RunnableSequence } from '@langchain/core/runnables'
import { createAutoParser } from 'langchain-react-chinese-parser'

// 1. 创建标准 ReAct Agent
const prompt = await pull('hwchase17/react')
const reactAgent = await createReactAgent({
  llm,
  tools,
  prompt,
  streamRunnable: true,
})

// 2. 用中文解析器增强 Agent Chain
const parser = createAutoParser({ debug: true })
const enhancedAgent = RunnableSequence.from([reactAgent, parser])

// 3. 创建 Agent 执行器
const agentExecutor = new AgentExecutor({
  agent: enhancedAgent,
  tools,
  verbose: true,
  maxIterations: 10,
})

// 4. 现在完美支持中文 ReAct 输出！
const result = await agentExecutor.invoke({
  input: '请帮我查询北京今天的天气',
})

方式三：完全自定义 Chain（高级用法）

如果你需要更灵活的控制，可以自定义 Agent Chain，把中文解析器作为最后一步：

import { RunnablePassthrough, RunnableSequence } from '@langchain/core/runnables'
import { formatLogToString } from 'langchain/agents'
import { createAutoParser } from 'langchain-react-chinese-parser'

const customAgentChain = RunnableSequence.from([
  RunnablePassthrough.assign({
    agent_scratchpad: (input) => formatLogToString(input.intermediate_steps || []),
  }),
  prompt,
  llm,
  createAutoParser({ debug: true }),
])

const agentExecutor = new AgentExecutor({
  agent: customAgentChain,
  tools,
  verbose: true,
})

升级现有项目：零侵入、无痛切换

如果你已经有自定义 Agent，只需替换解析器创建方式即可，无需改动其他业务逻辑：

// 原来
this.parser = new ReActSingleInputOutputParser()

// 现在
this.parser = createQwenParser({ debug: true, relaxedMode: true })
// 或
this.parser = createAutoParser({ debug: true })

实际效果

✅ 支持通义千问、ChatGLM、百川等主流中文大模型
✅ 解析成功率大幅提升，ReAct 推理链完整闭环
✅ 兼容中英文混合、格式变体，极大提升开发体验
✅ 工具调用、代码助手、数据分析等场景均可无缝集成

AI代码示例 - AI、LangChain

优势总结

🚀 一行代码集成，开箱即用
🔧 兼容所有 LangChain Agent 架构
🐛 解析成功率大幅提升，支持多种中文大模型
📈 现有项目零侵入升级，业务逻辑完全复用

总结

QwenReActOutputParser 已在实际项目中验证有效。如果你也遇到类似问题，欢迎试用 [langchain-react-chinese-parser]。

欢迎留言交流共建！