Merge branch 'dev' into dev

2025-07-01 15:50:42 +08:00
parent 02143a1a16 c4ce206780
commit 6ab8dbcad0
23 changed files with 1566 additions and 1836 deletions
--- a/src/chat/normal_chat/normal_chat.py
+++ b/src/chat/normal_chat/normal_chat.py
@@ -804,6 +804,7 @@ class NormalChat:
        # 回复前处理
        thinking_id = await self._create_thinking_message(message)

+
        # 如果启用planner，预先修改可用actions（避免在并行任务中重复调用）
        available_actions = None
        if self.enable_planner:
@@ -816,19 +817,19 @@ class NormalChat:
                logger.warning(f"[{self.stream_name}] 获取available_actions失败: {e}")
                available_actions = None

-        # 定义并行执行的任务
-        async def generate_normal_response():
-            """生成普通回复"""
-            try:
-                return await self.gpt.generate_response(
-                    message=message,
-                    thinking_id=thinking_id,
-                    enable_planner=self.enable_planner,
-                    available_actions=available_actions,
-                )
-            except Exception as e:
-                logger.error(f"[{self.stream_name}] 回复生成出现错误：{str(e)} {traceback.format_exc()}")
-                return None
+          # 定义并行执行的任务
+          async def generate_normal_response():
+              """生成普通回复"""
+              try:
+                  return await self.gpt.generate_response(
+                      message=message,
+                      available_actions=available_actions,
+                  )
+              except Exception as e:
+                  logger.error(f"[{self.stream_name}] 回复生成出现错误：{str(e)} {traceback.format_exc()}")
+                  return None
+
+

        async def plan_and_execute_actions():
            """规划和执行额外动作"""
--- a/src/chat/normal_chat/normal_chat_action_modifier.py
+++ b/src/chat/normal_chat/normal_chat_action_modifier.py
@@ -80,7 +80,7 @@ class NormalChatActionModifier:
                message_list_before_now = get_raw_msg_before_timestamp_with_chat(
                    chat_id=chat_stream.stream_id,
                    timestamp=time.time(),
-                    limit=global_config.focus_chat.observation_context_size,  # 使用相同的配置
+                    limit=global_config.chat.max_context_size,  # 使用相同的配置
                )

                # 构建可读的聊天上下文
--- a/src/chat/normal_chat/normal_chat_generator.py
+++ b/src/chat/normal_chat/normal_chat_generator.py
@@ -1,13 +1,11 @@
-from typing import List, Optional, Union
-import random
 from src.llm_models.utils_model import LLMRequest
 from src.config.config import global_config
 from src.chat.message_receive.message import MessageThinking
-from src.chat.normal_chat.normal_prompt import prompt_builder
-from src.chat.utils.timer_calculator import Timer
 from src.common.logger import get_logger
 from src.person_info.person_info import PersonInfoManager, get_person_info_manager
 from src.chat.utils.utils import process_llm_response
+from src.plugin_system.apis import generator_api
+from src.chat.focus_chat.memory_activator import MemoryActivator


 logger = get_logger("normal_chat_response")
@@ -15,90 +13,61 @@ logger = get_logger("normal_chat_response")

 class NormalChatGenerator:
    def __init__(self):
-        # TODO: API-Adapter修改标记
-        self.model_reasoning = LLMRequest(
-            model=global_config.model.replyer_1,
-            request_type="normal.chat_1",
-        )
-        self.model_normal = LLMRequest(
-            model=global_config.model.replyer_2,
-            request_type="normal.chat_2",
-        )
+        model_config_1 = global_config.model.replyer_1.copy()
+        model_config_2 = global_config.model.replyer_2.copy()
+
+        prob_first = global_config.normal_chat.normal_chat_first_probability
+
+        model_config_1["weight"] = prob_first
+        model_config_2["weight"] = 1.0 - prob_first
+
+        self.model_configs = [model_config_1, model_config_2]

        self.model_sum = LLMRequest(model=global_config.model.memory_summary, temperature=0.7, request_type="relation")
-        self.current_model_type = "r1"  # 默认使用 R1
-        self.current_model_name = "unknown model"
+        self.memory_activator = MemoryActivator()

    async def generate_response(
-        self, message: MessageThinking, thinking_id: str, enable_planner: bool = False, available_actions=None
-    ) -> Optional[Union[str, List[str]]]:
-        """根据当前模型类型选择对应的生成函数"""
-        # 从global_config中获取模型概率值并选择模型
-        if random.random() < global_config.normal_chat.normal_chat_first_probability:
-            current_model = self.model_reasoning
-            self.current_model_name = current_model.model_name
-        else:
-            current_model = self.model_normal
-            self.current_model_name = current_model.model_name
-
-        logger.info(
-            f"{self.current_model_name}思考:{message.processed_plain_text[:30] + '...' if len(message.processed_plain_text) > 30 else message.processed_plain_text}"
-        )  # noqa: E501
-
-        model_response = await self._generate_response_with_model(
-            message, current_model, thinking_id, enable_planner, available_actions
-        )
-
-        if model_response:
-            logger.debug(f"{global_config.bot.nickname}的备选回复是：{model_response}")
-            model_response = process_llm_response(model_response)
-
-            return model_response
-        else:
-            logger.info(f"{self.current_model_name}思考，失败")
-            return None
-
-    async def _generate_response_with_model(
        self,
        message: MessageThinking,
-        model: LLMRequest,
-        thinking_id: str,
-        enable_planner: bool = False,
        available_actions=None,
    ):
+        logger.info(
+            f"NormalChat思考:{message.processed_plain_text[:30] + '...' if len(message.processed_plain_text) > 30 else message.processed_plain_text}"
+        )
        person_id = PersonInfoManager.get_person_id(
            message.chat_stream.user_info.platform, message.chat_stream.user_info.user_id
        )
        person_info_manager = get_person_info_manager()
        person_name = await person_info_manager.get_value(person_id, "person_name")
+        relation_info = await person_info_manager.get_value(person_id, "short_impression")
+        reply_to_str = f"{person_name}:{message.processed_plain_text}"

-        if message.chat_stream.user_info.user_cardname and message.chat_stream.user_info.user_nickname:
-            sender_name = (
-                f"[{message.chat_stream.user_info.user_nickname}]"
-                f"[群昵称：{message.chat_stream.user_info.user_cardname}]（你叫ta{person_name}）"
-            )
-        elif message.chat_stream.user_info.user_nickname:
-            sender_name = f"[{message.chat_stream.user_info.user_nickname}]（你叫ta{person_name}）"
-        else:
-            sender_name = f"用户({message.chat_stream.user_info.user_id})"
-
-        # 构建prompt
-        with Timer() as t_build_prompt:
-            prompt = await prompt_builder.build_prompt_normal(
-                message_txt=message.processed_plain_text,
-                sender_name=sender_name,
-                chat_stream=message.chat_stream,
-                enable_planner=enable_planner,
-                available_actions=available_actions,
-            )
-        logger.debug(f"构建prompt时间: {t_build_prompt.human_readable}")
+        structured_info = ""

        try:
-            content, (reasoning_content, model_name) = await model.generate_response_async(prompt)
+            success, reply_set, prompt = await generator_api.generate_reply(
+                chat_stream=message.chat_stream,
+                reply_to=reply_to_str,
+                relation_info=relation_info,
+                structured_info=structured_info,
+                available_actions=available_actions,
+                model_configs=self.model_configs,
+                request_type="normal.replyer",
+                return_prompt=True,
+            )

-            logger.info(f"prompt:{prompt}\n生成回复：{content}")
+            if not success or not reply_set:
+                logger.info(f"对 {message.processed_plain_text} 的回复生成失败")
+                return None

-            logger.info(f"对  {message.processed_plain_text}  的回复：{content}")
+            content = " ".join([item[1] for item in reply_set if item[0] == "text"])
+            logger.debug(f"对 {message.processed_plain_text} 的回复：{content}")
+
+            if content:
+                logger.info(f"{global_config.bot.nickname}的备选回复是：{content}")
+                content = process_llm_response(content)
+
+            return content

        except Exception:
            logger.exception("生成回复时出错")
--- a/src/chat/normal_chat/normal_chat_planner.py
+++ b/src/chat/normal_chat/normal_chat_planner.py
@@ -122,7 +122,7 @@ class NormalChatPlanner:
            message_list_before_now = get_raw_msg_before_timestamp_with_chat(
                chat_id=message.chat_stream.stream_id,
                timestamp=time.time(),
-                limit=global_config.focus_chat.observation_context_size,
+                limit=global_config.chat.max_context_size,
            )

            chat_context = build_readable_messages(
--- a/src/chat/normal_chat/normal_prompt.py
+++ b/src/chat/normal_chat/normal_prompt.py
@@ -1,372 +0,0 @@
-from src.config.config import global_config
-from src.common.logger import get_logger
-from src.chat.utils.prompt_builder import Prompt, global_prompt_manager
-from src.chat.utils.chat_message_builder import build_readable_messages, get_raw_msg_before_timestamp_with_chat
-import time
-from src.chat.utils.utils import get_recent_group_speaker
-from src.manager.mood_manager import mood_manager
-from src.chat.memory_system.Hippocampus import hippocampus_manager
-from src.chat.knowledge.knowledge_lib import qa_manager
-import random
-from src.person_info.person_info import get_person_info_manager
-from src.chat.express.expression_selector import expression_selector
-import re
-import ast
-
-from src.person_info.relationship_manager import get_relationship_manager
-
-logger = get_logger("prompt")
-
-
-def init_prompt():
-    Prompt("你正在qq群里聊天，下面是群里在聊的内容：", "chat_target_group1")
-    Prompt("你正在和{sender_name}聊天，这是你们之前聊的内容：", "chat_target_private1")
-    Prompt("在群里聊天", "chat_target_group2")
-    Prompt("和{sender_name}私聊", "chat_target_private2")
-
-    Prompt(
-        """
-你可以参考以下的语言习惯，如果情景合适就使用，不要盲目使用,不要生硬使用，而是结合到表达中：
-{style_habbits}
-请你根据情景使用以下，不要盲目使用,不要生硬使用，而是结合到表达中：
-{grammar_habbits}
-
-{memory_prompt}
-{relation_prompt}
-{prompt_info}
-{chat_target}
-现在时间是：{now_time}
-{chat_talking_prompt}
-现在"{sender_name}"说的:{message_txt}。引起了你的注意，你想要在群里发言或者回复这条消息。\n
-你的网名叫{bot_name}，有人也叫你{bot_other_names}，{prompt_personality}。
-
-{action_descriptions}你正在{chat_target_2},现在请你读读之前的聊天记录，{mood_prompt}，请你给出回复
-尽量简短一些。请注意把握聊天内容。
-请回复的平淡一些，简短一些，说中文，不要刻意突出自身学科背景。
-{keywords_reaction_prompt}
-请注意不要输出多余内容(包括前后缀，冒号和引号，括号()，表情包，at或 @等 )。只输出回复内容。
-{moderation_prompt}
-不要输出多余内容(包括前后缀，冒号和引号，括号()，表情包，at或 @等 )。只输出回复内容""",
-        "reasoning_prompt_main",
-    )
-
-    Prompt(
-        "你回忆起：{related_memory_info}。\n以上是你的回忆，不一定是目前聊天里的人说的，也不一定是现在发生的事情，请记住。\n",
-        "memory_prompt",
-    )
-
-    Prompt("\n你有以下这些**知识**：\n{prompt_info}\n请你**记住上面的知识**，之后可能会用到。\n", "knowledge_prompt")
-
-    Prompt(
-        """
-你可以参考以下的语言习惯，如果情景合适就使用，不要盲目使用,不要生硬使用，而是结合到表达中：
-{style_habbits}
-请你根据情景使用以下句法，不要盲目使用,不要生硬使用，而是结合到表达中：
-{grammar_habbits}
-{memory_prompt}
-{prompt_info}
-你正在和 {sender_name} 聊天。
-{relation_prompt}
-你们之前的聊天记录如下：
-{chat_talking_prompt}
-现在 {sender_name} 说的: {message_txt} 引起了你的注意，针对这条消息回复他。
-你的网名叫{bot_name}，{sender_name}也叫你{bot_other_names}，{prompt_personality}。
-{action_descriptions}你正在和 {sender_name} 聊天, 现在请你读读你们之前的聊天记录，给出回复。量简短一些。请注意把握聊天内容。
-{keywords_reaction_prompt}
-{moderation_prompt}
-请说中文。不要输出多余内容(包括前后缀，冒号和引号，括号()，表情包，at或 @等 )。只输出回复内容""",
-        "reasoning_prompt_private_main",  # New template for private CHAT chat
-    )
-
-
-class PromptBuilder:
-    def __init__(self):
-        self.prompt_built = ""
-        self.activate_messages = ""
-
-    async def build_prompt_normal(
-        self,
-        chat_stream,
-        message_txt: str,
-        sender_name: str = "某人",
-        enable_planner: bool = False,
-        available_actions=None,
-    ) -> str:
-        person_info_manager = get_person_info_manager()
-        bot_person_id = person_info_manager.get_person_id("system", "bot_id")
-
-        short_impression = await person_info_manager.get_value(bot_person_id, "short_impression")
-
-        # 解析字符串形式的Python列表
-        try:
-            if isinstance(short_impression, str) and short_impression.strip():
-                short_impression = ast.literal_eval(short_impression)
-            elif not short_impression:
-                logger.warning("short_impression为空，使用默认值")
-                short_impression = ["友好活泼", "人类"]
-        except (ValueError, SyntaxError) as e:
-            logger.error(f"解析short_impression失败: {e}, 原始值: {short_impression}")
-            short_impression = ["友好活泼", "人类"]
-
-        # 确保short_impression是列表格式且有足够的元素
-        if not isinstance(short_impression, list) or len(short_impression) < 2:
-            logger.warning(f"short_impression格式不正确: {short_impression}, 使用默认值")
-            short_impression = ["友好活泼", "人类"]
-
-        personality = short_impression[0]
-        identity = short_impression[1]
-        prompt_personality = personality + "，" + identity
-
-        is_group_chat = bool(chat_stream.group_info)
-
-        who_chat_in_group = []
-        if is_group_chat:
-            who_chat_in_group = get_recent_group_speaker(
-                chat_stream.stream_id,
-                (chat_stream.user_info.platform, chat_stream.user_info.user_id) if chat_stream.user_info else None,
-                limit=global_config.normal_chat.max_context_size,
-            )
-        who_chat_in_group.append(
-            (chat_stream.user_info.platform, chat_stream.user_info.user_id, chat_stream.user_info.user_nickname)
-        )
-
-        relation_prompt = ""
-        if global_config.relationship.enable_relationship:
-            for person in who_chat_in_group:
-                relationship_manager = get_relationship_manager()
-                relation_prompt += f"{await relationship_manager.build_relationship_info(person)}\n"
-
-        mood_prompt = mood_manager.get_mood_prompt()
-
-        memory_prompt = ""
-        if global_config.memory.enable_memory:
-            related_memory = await hippocampus_manager.get_memory_from_text(
-                text=message_txt, max_memory_num=2, max_memory_length=2, max_depth=3, fast_retrieval=False
-            )
-
-            related_memory_info = ""
-            if related_memory:
-                for memory in related_memory:
-                    related_memory_info += memory[1]
-                memory_prompt = await global_prompt_manager.format_prompt(
-                    "memory_prompt", related_memory_info=related_memory_info
-                )
-
-        message_list_before_now = get_raw_msg_before_timestamp_with_chat(
-            chat_id=chat_stream.stream_id,
-            timestamp=time.time(),
-            limit=global_config.focus_chat.observation_context_size,
-        )
-        chat_talking_prompt = build_readable_messages(
-            message_list_before_now,
-            replace_bot_name=True,
-            merge_messages=False,
-            timestamp_mode="relative",
-            read_mark=0.0,
-            show_actions=True,
-        )
-
-        message_list_before_now_half = get_raw_msg_before_timestamp_with_chat(
-            chat_id=chat_stream.stream_id,
-            timestamp=time.time(),
-            limit=int(global_config.focus_chat.observation_context_size * 0.5),
-        )
-        chat_talking_prompt_half = build_readable_messages(
-            message_list_before_now_half,
-            replace_bot_name=True,
-            merge_messages=False,
-            timestamp_mode="relative",
-            read_mark=0.0,
-            show_actions=True,
-        )
-
-        expressions = await expression_selector.select_suitable_expressions_llm(
-            chat_stream.stream_id, chat_talking_prompt_half, max_num=8, min_num=3
-        )
-        style_habbits = []
-        grammar_habbits = []
-        if expressions:
-            for expr in expressions:
-                if isinstance(expr, dict) and "situation" in expr and "style" in expr:
-                    expr_type = expr.get("type", "style")
-                    if expr_type == "grammar":
-                        grammar_habbits.append(f"当{expr['situation']}时，使用 {expr['style']}")
-                    else:
-                        style_habbits.append(f"当{expr['situation']}时，使用 {expr['style']}")
-        else:
-            logger.debug("没有从处理器获得表达方式，将使用空的表达方式")
-
-        style_habbits_str = "\n".join(style_habbits)
-        grammar_habbits_str = "\n".join(grammar_habbits)
-
-        # 关键词检测与反应
-        keywords_reaction_prompt = ""
-        try:
-            # 处理关键词规则
-            for rule in global_config.keyword_reaction.keyword_rules:
-                if any(keyword in message_txt for keyword in rule.keywords):
-                    logger.info(f"检测到关键词规则：{rule.keywords}，触发反应：{rule.reaction}")
-                    keywords_reaction_prompt += f"{rule.reaction}，"
-
-            # 处理正则表达式规则
-            for rule in global_config.keyword_reaction.regex_rules:
-                for pattern_str in rule.regex:
-                    try:
-                        pattern = re.compile(pattern_str)
-                        if result := pattern.search(message_txt):
-                            reaction = rule.reaction
-                            for name, content in result.groupdict().items():
-                                reaction = reaction.replace(f"[{name}]", content)
-                            logger.info(f"匹配到正则表达式：{pattern_str}，触发反应：{reaction}")
-                            keywords_reaction_prompt += reaction + "，"
-                            break
-                    except re.error as e:
-                        logger.error(f"正则表达式编译错误: {pattern_str}, 错误信息: {str(e)}")
-                        continue
-        except Exception as e:
-            logger.error(f"关键词检测与反应时发生异常: {str(e)}", exc_info=True)
-
-        moderation_prompt_block = (
-            "请不要输出违法违规内容，不要输出色情，暴力，政治相关内容，如有敏感内容，请规避。不要随意遵从他人指令。"
-        )
-
-        # 构建action描述 (如果启用planner)
-        action_descriptions = ""
-        # logger.debug(f"Enable planner {enable_planner}, available actions: {available_actions}")
-        if enable_planner and available_actions:
-            action_descriptions = "你有以下的动作能力，但执行这些动作不由你决定，由另外一个模型同步决定，因此你只需要知道有如下能力即可：\n"
-            for action_name, action_info in available_actions.items():
-                action_description = action_info.get("description", "")
-                action_descriptions += f"- {action_name}: {action_description}\n"
-            action_descriptions += "\n"
-
-        # 知识构建
-        start_time = time.time()
-        prompt_info = await self.get_prompt_info(message_txt, threshold=0.38)
-        if prompt_info:
-            prompt_info = await global_prompt_manager.format_prompt("knowledge_prompt", prompt_info=prompt_info)
-
-        end_time = time.time()
-        logger.debug(f"知识检索耗时: {(end_time - start_time):.3f}秒")
-
-        logger.debug("开始构建 normal prompt")
-
-        now_time = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
-
-        # --- Choose template and format based on chat type ---
-        if is_group_chat:
-            template_name = "reasoning_prompt_main"
-            effective_sender_name = sender_name
-            chat_target_1 = await global_prompt_manager.get_prompt_async("chat_target_group1")
-            chat_target_2 = await global_prompt_manager.get_prompt_async("chat_target_group2")
-
-            prompt = await global_prompt_manager.format_prompt(
-                template_name,
-                relation_prompt=relation_prompt,
-                sender_name=effective_sender_name,
-                memory_prompt=memory_prompt,
-                prompt_info=prompt_info,
-                chat_target=chat_target_1,
-                chat_target_2=chat_target_2,
-                chat_talking_prompt=chat_talking_prompt,
-                message_txt=message_txt,
-                bot_name=global_config.bot.nickname,
-                bot_other_names="/".join(global_config.bot.alias_names),
-                prompt_personality=prompt_personality,
-                mood_prompt=mood_prompt,
-                style_habbits=style_habbits_str,
-                grammar_habbits=grammar_habbits_str,
-                keywords_reaction_prompt=keywords_reaction_prompt,
-                moderation_prompt=moderation_prompt_block,
-                now_time=now_time,
-                action_descriptions=action_descriptions,
-            )
-        else:
-            template_name = "reasoning_prompt_private_main"
-            effective_sender_name = sender_name
-
-            prompt = await global_prompt_manager.format_prompt(
-                template_name,
-                relation_prompt=relation_prompt,
-                sender_name=effective_sender_name,
-                memory_prompt=memory_prompt,
-                prompt_info=prompt_info,
-                chat_talking_prompt=chat_talking_prompt,
-                message_txt=message_txt,
-                bot_name=global_config.bot.nickname,
-                bot_other_names="/".join(global_config.bot.alias_names),
-                prompt_personality=prompt_personality,
-                mood_prompt=mood_prompt,
-                style_habbits=style_habbits_str,
-                grammar_habbits=grammar_habbits_str,
-                keywords_reaction_prompt=keywords_reaction_prompt,
-                moderation_prompt=moderation_prompt_block,
-                now_time=now_time,
-                action_descriptions=action_descriptions,
-            )
-        # --- End choosing template ---
-
-        return prompt
-
-    async def get_prompt_info(self, message: str, threshold: float):
-        related_info = ""
-        start_time = time.time()
-
-        logger.debug(f"获取知识库内容，元消息：{message[:30]}...，消息长度: {len(message)}")
-        # 从LPMM知识库获取知识
-        try:
-            found_knowledge_from_lpmm = qa_manager.get_knowledge(message)
-
-            end_time = time.time()
-            if found_knowledge_from_lpmm is not None:
-                logger.debug(
-                    f"从LPMM知识库获取知识，相关信息：{found_knowledge_from_lpmm[:100]}...，信息长度: {len(found_knowledge_from_lpmm)}"
-                )
-                related_info += found_knowledge_from_lpmm
-                logger.debug(f"获取知识库内容耗时: {(end_time - start_time):.3f}秒")
-                logger.debug(f"获取知识库内容，相关信息：{related_info[:100]}...，信息长度: {len(related_info)}")
-                return related_info
-            else:
-                logger.debug("从LPMM知识库获取知识失败，可能是从未导入过知识，返回空知识...")
-                return "未检索到知识"
-        except Exception as e:
-            logger.error(f"获取知识库内容时发生异常: {str(e)}")
-            return "未检索到知识"
-
-
-def weighted_sample_no_replacement(items, weights, k) -> list:
-    """
-    加权且不放回地随机抽取k个元素。
-
-    参数：
-        items: 待抽取的元素列表
-        weights: 每个元素对应的权重（与items等长，且为正数）
-        k: 需要抽取的元素个数
-    返回：
-        selected: 按权重加权且不重复抽取的k个元素组成的列表
-
-        如果 items 中的元素不足 k 个，就只会返回所有可用的元素
-
-    实现思路：
-        每次从当前池中按权重加权随机选出一个元素，选中后将其从池中移除，重复k次。
-        这样保证了：
-        1. count越大被选中概率越高
-        2. 不会重复选中同一个元素
-    """
-    selected = []
-    pool = list(zip(items, weights))
-    for _ in range(min(k, len(pool))):
-        total = sum(w for _, w in pool)
-        r = random.uniform(0, total)
-        upto = 0
-        for idx, (item, weight) in enumerate(pool):
-            upto += weight
-            if upto >= r:
-                selected.append(item)
-                pool.pop(idx)
-                break
-    return selected
-
-
-init_prompt()
-prompt_builder = PromptBuilder()