feat(planner): 重构动作决策逻辑与参数提取机制

本次提交对动作规划器（Planner）和动作（Action）的执行流程进行了重大重构，旨在提高决策的准确性和可靠性，使机器人能更精确地响应用户指令。核心变更: - **决策与参数提取分离**: 规划器（Planner）现在专注于根据用户意图选择最合适的动作，不再负责提取动作参数。 - **动作参数自解析**: `RemindAction` 等动作现在通过内部调用 LLM，从用户消息中自行解析所需参数，使其更加独立和健壮。 - **优化决策Prompt**: 引入“最高优先级检查”和“互斥原则”，强制优先执行由明确意图触发的特定动作（如 `set_reminder`），并在此情况下禁止选择 `reply`，避免重复响应。 - **增强调试**: 在处理循环中增加了日志，以清晰地记录LLM最终选择的动作组合，方便调试。
2025-09-16 14:00:33 +08:00
parent d0b630b212
commit cad85959d9
3 changed files with 78 additions and 41 deletions
--- a/src/chat/chat_loop/cycle_processor.py
+++ b/src/chat/chat_loop/cycle_processor.py
@@ -205,6 +205,13 @@ class CycleProcessor:
            raise UserWarning(f"插件{result.get_summary().get('stopped_handlers', '')}于规划前中断了内容生成")
        with Timer("规划器", cycle_timers):
            actions, _ = await self.action_planner.plan(mode=mode)
+            
+        # 在这里添加日志，清晰地显示最终选择的动作
+        if actions:
+            chosen_actions = [a.get("action_type", "unknown") for a in actions]
+            logger.info(f"{self.log_prefix} LLM最终选择的动作: {chosen_actions}")
+        else:
+            logger.info(f"{self.log_prefix} LLM最终没有选择任何动作")
        
        async def execute_action(action_info):
            """执行单个动作的通用函数"""
--- a/src/chat/planner_actions/planner_prompts.py
+++ b/src/chat/planner_actions/planner_prompts.py
@@ -35,10 +35,11 @@ def init_prompts():
 2.  **辅助动作 (可选)**: 这是为了增强表达效果的附加动作，例如 `emoji`（发送表情包）或 `poke_user`（戳一戳）。

 **决策流程:**
-1.  首先，决定是否要进行 `reply`。
-2.  然后，评估当前的对话气氛和用户情绪，判断是否需要一个**辅助动作**来让你的回应更生动、更符合你的性格。
-3.  如果需要，选择一个最合适的辅助动作与 `reply` 组合。
-4.  如果用户明确要求了某个动作，请务必优先满足。
+1.  **最高优先级检查**: 首先，检查是否有由 **关键词** 或 **LLM判断** 激活的特定动作（除了通用的 `reply`, `emoji` 等）。这些动作代表了用户的明确意图。
+2.  **执行明确意图**: 如果存在这类特定动作，你 **必须** 优先选择它作为主要响应。这比常规的文本回复 (`reply`) 更重要。
+3.  **常规回复**: 如果没有被特定意图激活的动作，再决定是否要进行 `reply`。
+4.  **辅助动作**: 在确定了主要动作后（无论是特定动作还是 `reply`），再评估是否需要 `emoji` 或 `poke_user` 等辅助动作来增强表达效果。
+5.  **互斥原则**: 当你选择了一个由明确意图激活的特定动作（如 `set_reminder`）时，你 **绝不能** 再选择 `reply` 动作，因为特定动作的执行结果（例如，设置提醒后的确认消息）本身就是一种回复。这是必须遵守的规则。

 **重要概念：将“理由”作为“内心思考”的体现**
 `reason` 字段是本次决策的核心。它并非一个简单的“理由”，而是 **一个模拟人类在回应前，头脑中自然浮现的、未经修饰的思绪流**。你需要完全代入 {identity_block} 的角色，将那一刻的想法自然地记录下来。
@@ -100,6 +101,18 @@ def init_prompts():
    }}
 ]

+**单动作示例 (特定动作):**
+[
+    {{
+        "action": "set_reminder",
+        "target_message_id": "m456",
+        "reason": "用户说‘提醒维尔薇下午三点去工坊’，这是一个非常明确的指令。根据决策流程，我必须优先执行这个特定动作，而不是进行常规回复。",
+        "user_name": "维尔薇",
+        "remind_time": "下午三点",
+        "event_details": "去工坊"
+    }}
+]
+
 **重要规则：**
 **重要规则：**
 当 `reply` 和 `emoji` 动作同时被选择时，`emoji` 动作的 `reason` 字段也应该体现出你的思考过程，并与 `reply` 的思考保持连贯。