Merge branch 'dev' of https://github.com/MoFox-Studio/MoFox_Bot into dev

2025-09-12 22:50:55 +08:00
parent 5e3efd3148 9b5eab9024
commit fcda224767
14 changed files with 524 additions and 83 deletions
--- a/src/chat/knowledge/knowledge_lib.py
+++ b/src/chat/knowledge/knowledge_lib.py
@@ -30,50 +30,55 @@ DATA_PATH = os.path.join(ROOT_PATH, "data")
 qa_manager = None
 inspire_manager = None

-# 检查LPMM知识库是否启用
-if global_config.lpmm_knowledge.enable:
-    logger.info("正在初始化Mai-LPMM")
-    logger.info("创建LLM客户端")

-    # 初始化Embedding库
-    embed_manager = EmbeddingManager()
-    logger.info("正在从文件加载Embedding库")
-    try:
-        embed_manager.load_from_file()
-    except Exception as e:
-        logger.warning(f"此消息不会影响正常使用：从文件加载Embedding库时，{e}")
-        # logger.warning("如果你是第一次导入知识，或者还未导入知识，请忽略此错误")
-    logger.info("Embedding库加载完成")
-    # 初始化KG
-    kg_manager = KGManager()
-    logger.info("正在从文件加载KG")
-    try:
-        kg_manager.load_from_file()
-    except Exception as e:
-        logger.warning(f"此消息不会影响正常使用：从文件加载KG时，{e}")
-        # logger.warning("如果你是第一次导入知识，或者还未导入知识，请忽略此错误")
-    logger.info("KG加载完成")
+def initialize_lpmm_knowledge():
+    """初始化LPMM知识库"""
+    global qa_manager, inspire_manager

-    logger.info(f"KG节点数量：{len(kg_manager.graph.get_node_list())}")
-    logger.info(f"KG边数量：{len(kg_manager.graph.get_edge_list())}")
+    # 检查LPMM知识库是否启用
+    if global_config.lpmm_knowledge.enable:
+        logger.info("正在初始化Mai-LPMM")
+        logger.info("创建LLM客户端")

-    # 数据比对：Embedding库与KG的段落hash集合
-    for pg_hash in kg_manager.stored_paragraph_hashes:
-        key = f"paragraph-{pg_hash}"
-        if key not in embed_manager.stored_pg_hashes:
-            logger.warning(f"KG中存在Embedding库中不存在的段落：{key}")
+        # 初始化Embedding库
+        embed_manager = EmbeddingManager()
+        logger.info("正在从文件加载Embedding库")
+        try:
+            embed_manager.load_from_file()
+        except Exception as e:
+            logger.warning(f"此消息不会影响正常使用：从文件加载Embedding库时，{e}")
+            # logger.warning("如果你是第一次导入知识，或者还未导入知识，请忽略此错误")
+        logger.info("Embedding库加载完成")
+        # 初始化KG
+        kg_manager = KGManager()
+        logger.info("正在从文件加载KG")
+        try:
+            kg_manager.load_from_file()
+        except Exception as e:
+            logger.warning(f"此消息不会影响正常使用：从文件加载KG时，{e}")
+            # logger.warning("如果你是第一次导入知识，或者还未导入知识，请忽略此错误")
+        logger.info("KG加载完成")

-    # 问答系统（用于知识库）
-    qa_manager = QAManager(
-        embed_manager,
-        kg_manager,
-    )
+        logger.info(f"KG节点数量：{len(kg_manager.graph.get_node_list())}")
+        logger.info(f"KG边数量：{len(kg_manager.graph.get_edge_list())}")

-    # # 记忆激活（用于记忆库）
-    # inspire_manager = MemoryActiveManager(
-    #     embed_manager,
-    #     llm_client_list[global_config["embedding"]["provider"]],
-    # )
-else:
-    logger.info("LPMM知识库已禁用，跳过初始化")
-    # 创建空的占位符对象，避免导入错误
+        # 数据比对：Embedding库与KG的段落hash集合
+        for pg_hash in kg_manager.stored_paragraph_hashes:
+            key = f"paragraph-{pg_hash}"
+            if key not in embed_manager.stored_pg_hashes:
+                logger.warning(f"KG中存在Embedding库中不存在的段落：{key}")
+
+        # 问答系统（用于知识库）
+        qa_manager = QAManager(
+            embed_manager,
+            kg_manager,
+        )
+
+        # # 记忆激活（用于记忆库）
+        # inspire_manager = MemoryActiveManager(
+        #     embed_manager,
+        #     llm_client_list[global_config["embedding"]["provider"]],
+        # )
+    else:
+        logger.info("LPMM知识库已禁用，跳过初始化")
+        # 创建空的占位符对象，避免导入错误
--- a/src/chat/replyer/default_generator.py
+++ b/src/chat/replyer/default_generator.py
@@ -86,7 +86,6 @@ def init_prompt():
 ### 当前群聊中的所有人的聊天记录：
 {background_dialogue_prompt}

-### 其他群聊中的聊天记录
 {cross_context_block}

 ### 当前群聊中正在与你对话的聊天记录
@@ -97,14 +96,10 @@ def init_prompt():
 {reply_style}
 {keywords_reaction_prompt}

- (如果有)你可以参考以下你在聊天中学到的表达方式：
 {expression_habits_block}
-## 工具信息
-(如果有)你可以参考以下可能有帮助的工具返回的信息：
+
 {tool_info_block}

-## 知识库信息
-(如果有)你可以参考以下可能有帮助的知识库中的信息：
 {knowledge_prompt}

 ## 其他信息
@@ -114,8 +109,8 @@ def init_prompt():
 {action_descriptions}

 ## 任务
-### 梗概
- 你正在一个QQ群里聊天，你需要理解整个群的聊天动态和话题走向，并做出自然的回应。
+
+*你正在一个QQ群里聊天，你需要理解整个群的聊天动态和话题走向，并做出自然的回应。*

 ### 核心任务
 - 你现在的主要任务是和 {sender_name} 聊天。同时，也有其他用户会参与聊天，你可以参考他们的回复内容，但是你现在想回复{sender_name}的发言。
--- a/src/chat/utils/prompt.py
+++ b/src/chat/utils/prompt.py
@@ -550,7 +550,7 @@ class Prompt:
            # 构建表达习惯块
            if selected_expressions:
                style_habits_str = "\n".join([f"- {expr}" for expr in selected_expressions])
-                expression_habits_block = f"你可以参考以下的语言习惯，当情景合适就使用，但不要生硬使用，以合理的方式结合到你的回复中：\n{style_habits_str}"
+                expression_habits_block = f"- 你可以参考以下的语言习惯，当情景合适就使用，但不要生硬使用，以合理的方式结合到你的回复中：\n{style_habits_str}"
            else:
                expression_habits_block = ""
            
@@ -652,7 +652,7 @@ class Prompt:
            
            # 构建工具信息块
            if tool_results:
-                tool_info_parts = ["以下是你通过工具获取到的实时信息："]
+                tool_info_parts = ["## 工具信息","以下是你通过工具获取到的实时信息："]
                for tool_result in tool_results:
                    tool_name = tool_result.get("tool_name", "unknown")
                    content = tool_result.get("content", "")
@@ -697,7 +697,7 @@ class Prompt:
            
            # 构建知识块
            if knowledge_results and knowledge_results.get("knowledge_items"):
-                knowledge_parts = ["以下是与你当前对话相关的知识信息："]
+                knowledge_parts = ["## 知识库信息","以下是与你当前对话相关的知识信息："]
                
                for item in knowledge_results["knowledge_items"]:
                    content = item.get("content", "")