fix：提供更自定义的max_token配置

弱智api服务商输出</think>输出一半被max_tokens截断了
2025-06-05 10:18:50 +08:00
parent 4ebfca096c
commit 303e920e3a
4 changed files with 35 additions and 8 deletions
--- a/src/chat/focus_chat/planners/planner_simple.py
+++ b/src/chat/focus_chat/planners/planner_simple.py
@@ -78,13 +78,11 @@ class ActionPlanner(BasePlanner):
        # LLM规划器配置
        self.planner_llm = LLMRequest(
            model=global_config.model.planner,
-            max_tokens=1000,
            request_type="focus.planner",  # 用于动作规划
        )

        self.utils_llm = LLMRequest(
            model=global_config.model.utils_small,
-            max_tokens=1000,
            request_type="focus.planner",  # 用于动作规划
        )

@@ -188,6 +186,12 @@ class ActionPlanner(BasePlanner):
                llm_content, (reasoning_content, _) = await self.planner_llm.generate_response_async(prompt=prompt)

                logger.debug(f"{self.log_prefix}LLM 原始理由响应: {reasoning_content}")
+                
+                logger.info(f"{self.log_prefix}规划器原始提示词: {prompt}")
+                logger.info(f"{self.log_prefix}规划器原始响应: {llm_content}")
+                logger.info(f"{self.log_prefix}规划器推理: {reasoning_content}")
+                
+                
            except Exception as req_e:
                logger.error(f"{self.log_prefix}LLM 请求执行失败: {req_e}")
                reasoning = f"LLM 请求失败，你的模型出现问题: {req_e}"
--- a/src/chat/normal_chat/normal_chat_planner.py
+++ b/src/chat/normal_chat/normal_chat_planner.py
@@ -43,8 +43,7 @@ def init_prompt():

 基于以上聊天上下文和用户的最新消息，选择最合适的action。

-请以动作的输出要求，以严格的 JSON 格式输出，且仅包含 JSON 内容。
-请输出你提取的JSON，不要有任何其他文字或解释：
+请以动作的输出要求，以严格的 JSON 格式输出，且仅包含 JSON 内容。不要有任何其他文字或解释：
 """,
        "normal_chat_planner_prompt",
    )
@@ -70,7 +69,6 @@ class NormalChatPlanner:
        # LLM规划器配置
        self.planner_llm = LLMRequest(
            model=global_config.model.planner,
-            max_tokens=1000,
            request_type="normal_chat.planner",  # 用于normal_chat动作规划
        )