feat：支持回复和at正确解析

2025-05-12 23:17:09 +08:00
parent 3a11c0136b
commit 7a46b56781
6 changed files with 84 additions and 12 deletions
--- a/src/heart_flow/chat_state_info.py
+++ b/src/heart_flow/chat_state_info.py
@@ -10,7 +10,7 @@ class ChatState(enum.Enum):
 class ChatStateInfo:
    def __init__(self):
-        self.chat_status: ChatState = ChatState.ABSENT
+        self.chat_status: ChatState = ChatState.CHAT
        self.current_state_time = 120
        self.mood_manager = MoodManager()
--- a/src/heart_flow/sub_heartflow.py
+++ b/src/heart_flow/sub_heartflow.py
@@ -295,9 +295,6 @@ class SubHeartflow:
    def get_all_observations(self) -> list[Observation]:
        return self.observations
    def clear_observations(self):
        self.observations.clear()
    def _get_primary_observation(self) -> Optional[ChattingObservation]:
        if self.observations and isinstance(self.observations[0], ChattingObservation):
            return self.observations[0]
--- a/src/plugins/heartFC_chat/expressors/exprssion_learner.py
+++ b/src/plugins/heartFC_chat/expressors/exprssion_learner.py
@@ -1,4 +1,5 @@
 import time
 import random
 from typing import List, Dict, Optional, Any, Tuple, Coroutine
 from src.common.logger_manager import get_logger
 from src.plugins.models.utils_model import LLMRequest
@@ -8,6 +9,9 @@ from src.plugins.heartFC_chat.heartflow_prompt_builder import Prompt, global_pro
 import os
 import json
 MAX_EXPRESSION_COUNT = 300
 logger = get_logger("expressor")
@@ -52,6 +56,18 @@ class ExpressionLearner:
            expressions: List[dict] = json.load(f)
        return expressions
    def is_similar(self, s1: str, s2: str) -> bool:
        """
        判断两个字符串是否相似（只考虑长度大于5且有80%以上重合，不考虑子串）
        """
        if not s1 or not s2:
            return False
        min_len = min(len(s1), len(s2))
        if min_len < 5:
            return False
        same = sum(1 for a, b in zip(s1, s2) if a == b)
        return same / min_len > 0.8
    async def learn_and_store_expression(self) -> List[Tuple[str, str, str]]:
        """选择从当前到最近1小时内的随机10条消息，然后学习这些消息的表达方式"""
        logger.info("开始学习表达方式...")
@@ -74,15 +90,40 @@ class ExpressionLearner:
            file_path = os.path.join(dir_path, "expressions.json")
            # 若已存在，先读出合并
            if os.path.exists(file_path):
-                old_data: List[Dict[str, str]] = []
+                old_data: List[Dict[str, str, str]] = []
                try:
                    with open(file_path, "r", encoding="utf-8") as f:
                        old_data = json.load(f)
                except Exception:
                    old_data = []
-                expr_list = old_data + expr_list
+            else:
                old_data = []
            # 超过最大数量时，20%概率移除count=1的项
            if len(old_data) >= MAX_EXPRESSION_COUNT:
                delete = True
                new_old_data = []
                for item in old_data:
                    if item.get("count", 1) == 1 and random.random() < 0.2:
                        continue  # 20%概率移除
                    new_old_data.append(item)
                old_data = new_old_data
            # 合并逻辑
            for new_expr in expr_list:
                found = False
                for old_expr in old_data:
                    if self.is_similar(new_expr["situation"], old_expr.get("situation", "")) and self.is_similar(new_expr["style"], old_expr.get("style", "")):
                        found = True
                        # 50%概率替换
                        if random.random() < 0.5:
                            old_expr["situation"] = new_expr["situation"]
                            old_expr["style"] = new_expr["style"]
                        old_expr["count"] = old_expr.get("count", 1) + 1
                        break
                if not found:
                    new_expr["count"] = 1
                    old_data.append(new_expr)
            with open(file_path, "w", encoding="utf-8") as f:
-                json.dump(expr_list, f, ensure_ascii=False, indent=2)
+                json.dump(old_data, f, ensure_ascii=False, indent=2)
        return expressions
    async def learn_expression(self) -> Optional[List[Tuple[str, str, str]]]:
--- a/src/plugins/heartFC_chat/heartflow_prompt_builder.py
+++ b/src/plugins/heartFC_chat/heartflow_prompt_builder.py
@@ -86,7 +86,7 @@ def init_prompt():
 {{
    "action": "reply",
    "text": "你想表达的内容",
-    "emojis": "表情关键词",
+    "emojis": "描述当前使用表情包的场景",
    "target": "你想要回复的原始文本内容（非必须，仅文本，不包含发送者)",
    "reasoning": "你的决策理由",
 }}
--- a/src/plugins/utils/chat_message_builder.py
+++ b/src/plugins/utils/chat_message_builder.py
@@ -8,6 +8,7 @@ from src.config.config import global_config
 from typing import List, Dict, Any, Tuple  # 确保类型提示被导入
 import time  # 导入 time 模块以获取当前时间
 import random
 import re
 # 导入新的 repository 函数
 from src.common.message_repository import find_messages, count_messages
@@ -215,10 +216,43 @@ async def _build_readable_messages_internal(
            else:
                person_name = "某人"
        # 检查是否有 回复<aaa:bbb> 字段
        reply_pattern = r"回复<([^:<>]+):([^:<>]+)>"
        match = re.search(reply_pattern, content)
        if match:
            aaa = match.group(1)
            bbb = match.group(2)
            reply_person_id = person_info_manager.get_person_id(platform, bbb)
            reply_person_name = await person_info_manager.get_value(reply_person_id, "person_name")
            if not reply_person_name:
                reply_person_name = aaa
            # 在内容前加上回复信息
            content = re.sub(reply_pattern, f"回复 {reply_person_name}", content, count=1)
        # 检查是否有 @<aaa:bbb> 字段 @<{member_info.get('nickname')}:{member_info.get('user_id')}>
        at_pattern = r"@<([^:<>]+):([^:<>]+)>"
        at_matches = list(re.finditer(at_pattern, content))
        if at_matches:
            new_content = ""
            last_end = 0
            for m in at_matches:
                new_content += content[last_end:m.start()]
                aaa = m.group(1)
                bbb = m.group(2)
                at_person_id = person_info_manager.get_person_id(platform, bbb)
                at_person_name = await person_info_manager.get_value(at_person_id, "person_name")
                if not at_person_name:
                    at_person_name = aaa
                new_content += f"@{at_person_name}"
                last_end = m.end()
            new_content += content[last_end:]
            content = new_content
        message_details_raw.append((timestamp, person_name, content))
    if not message_details_raw:
-        return "", []
+        return "", []            
    message_details_raw.sort(key=lambda x: x[0])  # 按时间戳(第一个元素)升序排序，越早的消息排在前面
--- a/template/bot_config_template.toml
+++ b/template/bot_config_template.toml
@@ -66,11 +66,11 @@ time_zone = "Asia/Shanghai" # 给你的机器人设置时区，可以解决运
 nonebot-qq="http://127.0.0.1:18002/api/message"
 [chat] #麦麦的聊天通用设置
-allow_focus_mode = true # 是否允许专注聊天状态
+allow_focus_mode = false # 是否允许专注聊天状态
 # 是否启用heart_flowC(HFC)模式
 # 启用后麦麦会自主选择进入heart_flowC模式（持续一段时间），进行主动的观察和回复，并给出回复，比较消耗token
-base_normal_chat_num = 8 # 最多允许多少个群进行普通聊天
+base_normal_chat_num = 999 # 最多允许多少个群进行普通聊天
-base_focused_chat_num = 5 # 最多允许多少个群进行专注聊天
+base_focused_chat_num = 4 # 最多允许多少个群进行专注聊天
 observation_context_size = 15 # 观察到的最长上下文大小,建议15，太短太长都会导致脑袋尖尖
 message_buffer = true # 启用消息缓冲器？启用此项以解决消息的拆分问题，但会使麦麦的回复延迟