better：优化prompt和配置和无用代码

2025-07-24 02:37:11 +08:00
parent bc4e7db78a
commit b839f8ba6c
10 changed files with 78 additions and 175 deletions
--- a/src/chat/replyer/default_generator.py
+++ b/src/chat/replyer/default_generator.py
@@ -30,9 +30,6 @@ from src.plugin_system.base.component_types import ActionInfo

 logger = get_logger("replyer")

-ENABLE_S2S_MODE = True
-
-
 def init_prompt():
    Prompt("你正在qq群里聊天，下面是群里在聊的内容：", "chat_target_group1")
    Prompt("你正在和{sender_name}聊天，这是你们之前聊的内容：", "chat_target_private1")
@@ -97,29 +94,29 @@ def init_prompt():
 {relation_info_block}
 {extra_info_block}

-你是一个AI虚拟主播，正在直播QQ聊天，同时也在直播间回复弹幕，不过回复的时候不用过多提及这点

 {identity}

 {action_descriptions}
-你现在的主要任务是和 {sender_name} 聊天。同时，也有其他用户会参与你们的聊天，你可以参考他们的回复内容，但是你主要还是关注你和{sender_name}的聊天内容。你现在的心情是：{mood_state}
+你现在的主要任务是和 {sender_name} 聊天。同时，也有其他用户会参与你们的聊天，你可以参考他们的回复内容，但是你主要还是关注你和{sender_name}的聊天内容。

 {background_dialogue_prompt}
 --------------------------------
 {time_block}
 这是你和{sender_name}的对话，你们正在交流中：
+
 {core_dialogue_prompt}

 {reply_target_block}
 对方最新发送的内容：{message_txt}
-回复可以简短一些。可以参考贴吧，知乎和微博的回复风格，回复不要浮夸，不要用夸张修辞，平淡一些。
-{config_expression_style}。注意不要复读你说过的话
+你现在的心情是：{mood_state}
+{config_expression_style}
+注意不要复读你说过的话
 {keywords_reaction_prompt}
 请注意不要输出多余内容(包括前后缀，冒号和引号，at或 @等 )。只输出回复内容。
 {moderation_prompt}
-不要浮夸，不要夸张修辞，不要输出多余内容(包括前后缀，冒号和引号，括号()，表情包，at或 @等 )。只输出回复内容，现在{sender_name}正在等待你的回复。
-你的回复风格不要浮夸，有逻辑和条理，请你继续回复{sender_name}。
-你的发言：
+不要浮夸，不要夸张修辞，不要输出多余内容(包括前后缀，冒号和引号，括号()，表情包，at或 @等 )。只输出一条回复内容就好
+现在，你说：
 """,
        "s4u_style_prompt",
    )
@@ -132,7 +129,6 @@ class DefaultReplyer:
        model_configs: Optional[List[Dict[str, Any]]] = None,
        request_type: str = "focus.replyer",
    ):
-        self.log_prefix = "replyer"
        self.request_type = request_type

        if model_configs:
@@ -196,7 +192,7 @@ class DefaultReplyer:
                }
                for key, value in reply_data.items():
                    if not value:
-                        logger.debug(f"{self.log_prefix} 回复数据跳过{key}，生成回复时将忽略。")
+                        logger.debug(f"回复数据跳过{key}，生成回复时将忽略。")

            # 3. 构建 Prompt
            with Timer("构建Prompt", {}):  # 内部计时器，可选保留
@@ -217,7 +213,7 @@ class DefaultReplyer:
                    # 加权随机选择一个模型配置
                    selected_model_config = self._select_weighted_model_config()
                    logger.info(
-                        f"{self.log_prefix} 使用模型配置: {selected_model_config.get('name', 'N/A')} (权重: {selected_model_config.get('weight', 1.0)})"
+                        f"使用模型生成回复: {selected_model_config.get('name', 'N/A')} (选中概率: {selected_model_config.get('weight', 1.0)})"
                    )

                    express_model = LLMRequest(
@@ -226,9 +222,9 @@ class DefaultReplyer:
                    )

                    if global_config.debug.show_prompt:
-                        logger.info(f"{self.log_prefix}\n{prompt}\n")
+                        logger.info(f"\n{prompt}\n")
                    else:
-                        logger.debug(f"{self.log_prefix}\n{prompt}\n")
+                        logger.debug(f"\n{prompt}\n")

                    content, (reasoning_content, model_name) = await express_model.generate_response_async(prompt)

@@ -236,13 +232,13 @@ class DefaultReplyer:

            except Exception as llm_e:
                # 精简报错信息
-                logger.error(f"{self.log_prefix}LLM 生成失败: {llm_e}")
+                logger.error(f"LLM 生成失败: {llm_e}")
                return False, None, prompt  # LLM 调用失败则无法生成回复

            return True, content, prompt

        except Exception as e:
-            logger.error(f"{self.log_prefix}回复生成意外失败: {e}")
+            logger.error(f"回复生成意外失败: {e}")
            traceback.print_exc()
            return False, None, prompt

@@ -273,7 +269,7 @@ class DefaultReplyer:
            reasoning_content = None
            model_name = "unknown_model"
            if not prompt:
-                logger.error(f"{self.log_prefix}Prompt 构建失败，无法生成回复。")
+                logger.error(f"Prompt 构建失败，无法生成回复。")
                return False, None

            try:
@@ -281,7 +277,7 @@ class DefaultReplyer:
                    # 加权随机选择一个模型配置
                    selected_model_config = self._select_weighted_model_config()
                    logger.info(
-                        f"{self.log_prefix} 使用模型配置进行重写: {selected_model_config.get('name', 'N/A')} (权重: {selected_model_config.get('weight', 1.0)})"
+                        f"使用模型重写回复: {selected_model_config.get('name', 'N/A')} (选中概率: {selected_model_config.get('weight', 1.0)})"
                    )

                    express_model = LLMRequest(
@@ -295,13 +291,13 @@ class DefaultReplyer:

            except Exception as llm_e:
                # 精简报错信息
-                logger.error(f"{self.log_prefix}LLM 生成失败: {llm_e}")
+                logger.error(f"LLM 生成失败: {llm_e}")
                return False, None  # LLM 调用失败则无法生成回复

            return True, content

        except Exception as e:
-            logger.error(f"{self.log_prefix}回复生成意外失败: {e}")
+            logger.error(f"回复生成意外失败: {e}")
            traceback.print_exc()
            return False, None

@@ -321,7 +317,7 @@ class DefaultReplyer:
        person_info_manager = get_person_info_manager()
        person_id = person_info_manager.get_person_id_by_person_name(sender)
        if not person_id:
-            logger.warning(f"{self.log_prefix} 未找到用户 {sender} 的ID，跳过信息提取")
+            logger.warning(f"未找到用户 {sender} 的ID，跳过信息提取")
            return f"你完全不认识{sender}，不理解ta的相关信息。"

        return await relationship_fetcher.build_relation_info(person_id, points_num=5)
@@ -340,7 +336,7 @@ class DefaultReplyer:
        )

        if selected_expressions:
-            logger.debug(f"{self.log_prefix} 使用处理器选中的{len(selected_expressions)}个表达方式")
+            logger.debug(f"使用处理器选中的{len(selected_expressions)}个表达方式")
            for expr in selected_expressions:
                if isinstance(expr, dict) and "situation" in expr and "style" in expr:
                    expr_type = expr.get("type", "style")
@@ -349,7 +345,7 @@ class DefaultReplyer:
                    else:
                        style_habits.append(f"当{expr['situation']}时，使用 {expr['style']}")
        else:
-            logger.debug(f"{self.log_prefix} 没有从处理器获得表达方式，将使用空的表达方式")
+            logger.debug(f"没有从处理器获得表达方式，将使用空的表达方式")
            # 不再在replyer中进行随机选择，全部交给处理器处理

        style_habits_str = "\n".join(style_habits)
@@ -431,14 +427,14 @@ class DefaultReplyer:
                    tool_info_str += f"- 【{tool_name}】{result_type}: {content}\n"

                tool_info_str += "以上是你获取到的实时信息，请在回复时参考这些信息。"
-                logger.info(f"{self.log_prefix} 获取到 {len(tool_results)} 个工具结果")
+                logger.info(f"获取到 {len(tool_results)} 个工具结果")
                return tool_info_str
            else:
-                logger.debug(f"{self.log_prefix} 未获取到任何工具结果")
+                logger.debug(f"未获取到任何工具结果")
                return ""

        except Exception as e:
-            logger.error(f"{self.log_prefix} 工具信息获取失败: {e}")
+            logger.error(f"工具信息获取失败: {e}")
            return ""

    def _parse_reply_target(self, target_message: str) -> tuple:
@@ -630,31 +626,40 @@ class DefaultReplyer:
        # 并行执行四个构建任务
        task_results = await asyncio.gather(
            self._time_and_run_task(
-                self.build_expression_habits(chat_talking_prompt_short, target), "build_expression_habits"
+                self.build_expression_habits(chat_talking_prompt_short, target), "expression_habits"
            ),
            self._time_and_run_task(
-                self.build_relation_info(reply_data), "build_relation_info"
+                self.build_relation_info(reply_data), "relation_info"
            ),
-            self._time_and_run_task(self.build_memory_block(chat_talking_prompt_short, target), "build_memory_block"),
+            self._time_and_run_task(self.build_memory_block(chat_talking_prompt_short, target), "memory_block"),
            self._time_and_run_task(
-                self.build_tool_info(chat_talking_prompt_short, reply_data, enable_tool=enable_tool), "build_tool_info"
+                self.build_tool_info(chat_talking_prompt_short, reply_data, enable_tool=enable_tool), "tool_info"
            ),
        )

+        # 任务名称中英文映射
+        task_name_mapping = {
+            "expression_habits": "选取表达方式",
+            "relation_info": "感受关系", 
+            "memory_block": "回忆",
+            "tool_info": "使用工具"
+        }
+
        # 处理结果
        timing_logs = []
        results_dict = {}
        for name, result, duration in task_results:
            results_dict[name] = result
-            timing_logs.append(f"{name}: {duration:.4f}s")
+            chinese_name = task_name_mapping.get(name, name)
+            timing_logs.append(f"{chinese_name}: {duration:.1f}s")
            if duration > 8:
-                logger.warning(f"回复生成前信息获取耗时过长: {name} 耗时: {duration:.4f}s，请使用更快的模型")
-        logger.info(f"回复生成前信息获取耗时: {'; '.join(timing_logs)}")
+                logger.warning(f"回复生成前信息获取耗时过长: {chinese_name} 耗时: {duration:.1f}s，请使用更快的模型")
+        logger.info(f"在回复前的步骤耗时: {'; '.join(timing_logs)}")

-        expression_habits_block = results_dict["build_expression_habits"]
-        relation_info = results_dict["build_relation_info"]
-        memory_block = results_dict["build_memory_block"]
-        tool_info = results_dict["build_tool_info"]
+        expression_habits_block = results_dict["expression_habits"]
+        relation_info = results_dict["relation_info"]
+        memory_block = results_dict["memory_block"]
+        tool_info = results_dict["tool_info"]

        keywords_reaction_prompt = await self.build_keywords_reaction_prompt(target)