Published on

LangChain ReAct 中文解析器实现

Authors
  • avatar
    Name
    青雲
    Twitter

背景与痛点

在用 LangChainJS 开发 Agent 时,ReAct(Reasoning and Acting)模式是最主流的推理与工具调用范式。它要求大模型输出结构化的推理链条,例如:

Thought: 我需要查找相关信息
Action: search
Action Input: 搜索内容
Observation: 搜索结果...
Final Answer: 基于搜索结果的回答

但实际开发中,发现 LangChain 原生的 ReActSingleInputOutputParser 只支持英文关键字,无法正确解析通义千问等中文大模型的输出。比如,模型输出“思考”、“动作”、“最终答案”等中文字段时,原生解析器会直接报错,导致 ReAct 推理链断裂,工具调用失败。

现有方案的不足

网上查阅资料后发现,LangChain 社区对中文模型的 ReAct 兼容性支持非常有限。大部分方案要么要求模型输出英文格式,要么只能降级为简单对话,无法实现完整的“思考-行动-观察-再思考-最终答案”推理链。

解决方案:QwenReActOutputParser

为了解决这个痛点,我开发了 langchain-react-chinese-parser,核心是自定义的 QwenReActOutputParser,专门为通义千问等中文大模型适配 ReAct 解析。

设计思路

  • 中英文关键字兼容:支持“思考/动作/最终答案”等中英文混合关键字
  • 格式容错:智能识别各种输出变体,提升解析鲁棒性
  • 错误提示:解析失败时给出清晰的格式指导,提升开发体验
  • 工程无侵入:无需修改 LangChain 核心代码,直接集成即可

核心架构

┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐
│ 用户输入 │───▶│ QwenReActAgent │───▶│ 工具执行 │
└─────────────────┘ └──────────────────┘ └─────────────────┘
┌──────────────────┐
│ QwenReActOutput │
│ Parser │
└──────────────────┘

关键字映射

const KEYWORD_MAPPINGS = {
  thought: ['思考', '想法', 'thought', 'think'],
  action: ['动作', '行动', 'action', 'act'],
  actionInput: ['动作输入', '行动输入', 'action input', 'action_input'],
  finalAnswer: ['最终答案', '答案', 'final answer', 'answer'],
}

解析核心逻辑

export class QwenReActOutputParser extends BaseOutputParser<AgentAction | AgentFinish> {
  async parse(text: string): Promise<AgentAction | AgentFinish> {
    // 1. 预处理文本
    const cleanedText = this.preprocessText(text)

    // 2. 检查是否有最终答案
    if (this.containsFinalAnswer(cleanedText)) {
      return this.parseFinalAnswer(cleanedText)
    }

    // 3. 动作解析
    const actionMatch = this.parseAction(cleanedText)
    if (actionMatch) {
      return actionMatch
    }

    // 4. 错误处理
    throw new OutputParserException(
      `无法解析输出格式。请使用以下格式:
      思考: [你的思考过程]
      动作: [工具名称]
      动作输入: [工具参数]`
    )
  }
}

工程集成

好的,以下是参考 langchain-react-chinese-parser/README.md 的「工程集成」部分,结合你的项目背景,整理出的中文技术分享文章片段,可直接用于博客或社区发文:


工程集成

langchain-react-chinese-parser 的设计目标就是让工程集成变得极其简单,无论你是自定义 Agent 还是用官方 createReactAgent,都能一行代码切换为中文解析器,极大提升开发效率和兼容性。

方式一:自定义 Agent 类中集成(推荐)

如果你有自定义的 Agent 类,只需用我们的解析器替换原生解析器即可:

import { createQwenParser, createAutoParser } from 'langchain-react-chinese-parser'

export class QwenReActAgent {
  private parser

  constructor(options = {}) {
    // 替换为通义千问专用解析器
    this.parser = createQwenParser({ debug: true, relaxedMode: true })
    // 或者用自动识别解析器
    // this.parser = createAutoParser({ debug: true });
  }

  async invoke(input: string) {
    // ... 你的 Agent 逻辑 ...
    const rawOutput = await this.llm.invoke(prompt)

    try {
      // 用中文解析器解析输出
      const parsed = await this.parser.parse(rawOutput)

      if ('tool' in parsed) {
        // 工具调用
        return await this.executeTool(parsed)
      } else {
        // 最终答案
        return { output: parsed.returnValues.output }
      }
    } catch (error) {
      console.error('解析失败:', error.message)
      throw error
    }
  }
}

方式二:官方 createReactAgent + 自定义解析器

如果你用的是 LangChain 官方的 createReactAgent,可以这样集成:

import { AgentExecutor, createReactAgent } from 'langchain/agents'
import { pull } from 'langchain/hub'
import { RunnableSequence } from '@langchain/core/runnables'
import { createAutoParser } from 'langchain-react-chinese-parser'

// 1. 创建标准 ReAct Agent
const prompt = await pull('hwchase17/react')
const reactAgent = await createReactAgent({
  llm,
  tools,
  prompt,
  streamRunnable: true,
})

// 2. 用中文解析器增强 Agent Chain
const parser = createAutoParser({ debug: true })
const enhancedAgent = RunnableSequence.from([reactAgent, parser])

// 3. 创建 Agent 执行器
const agentExecutor = new AgentExecutor({
  agent: enhancedAgent,
  tools,
  verbose: true,
  maxIterations: 10,
})

// 4. 现在完美支持中文 ReAct 输出!
const result = await agentExecutor.invoke({
  input: '请帮我查询北京今天的天气',
})

方式三:完全自定义 Chain(高级用法)

如果你需要更灵活的控制,可以自定义 Agent Chain,把中文解析器作为最后一步:

import { RunnablePassthrough, RunnableSequence } from '@langchain/core/runnables'
import { formatLogToString } from 'langchain/agents'
import { createAutoParser } from 'langchain-react-chinese-parser'

const customAgentChain = RunnableSequence.from([
  RunnablePassthrough.assign({
    agent_scratchpad: (input) => formatLogToString(input.intermediate_steps || []),
  }),
  prompt,
  llm,
  createAutoParser({ debug: true }),
])

const agentExecutor = new AgentExecutor({
  agent: customAgentChain,
  tools,
  verbose: true,
})

升级现有项目:零侵入、无痛切换

如果你已经有自定义 Agent,只需替换解析器创建方式即可,无需改动其他业务逻辑:

// 原来
this.parser = new ReActSingleInputOutputParser()

// 现在
this.parser = createQwenParser({ debug: true, relaxedMode: true })
// 或
this.parser = createAutoParser({ debug: true })

实际效果

  • ✅ 支持通义千问、ChatGLM、百川等主流中文大模型
  • ✅ 解析成功率大幅提升,ReAct 推理链完整闭环
  • ✅ 兼容中英文混合、格式变体,极大提升开发体验
  • ✅ 工具调用、代码助手、数据分析等场景均可无缝集成

优势总结

  • 🚀 一行代码集成,开箱即用
  • 🔧 兼容所有 LangChain Agent 架构
  • 🐛 解析成功率大幅提升,支持多种中文大模型
  • 📈 现有项目零侵入升级,业务逻辑完全复用

总结

QwenReActOutputParser 已在实际项目中验证有效。如果你也遇到类似问题,欢迎试用 [langchain-react-chinese-parser]。


欢迎留言交流共建!