feat(affinity-flow): 实现回复后关系追踪系统集成

- 在relationship_tracker.py中添加数据库支持的回复后关系追踪功能 - 新增UserRelationships数据库模型存储用户关系数据 - 集成全局关系追踪器到planner和interest_scoring系统 - 优化兴趣度评分系统的关系分获取逻辑，优先使用数据库存储的关系分 - 在plan_executor中执行回复后关系追踪，分析用户反应并更新关系 - 添加LLM响应清理功能确保JSON解析稳定性 - 更新模型配置模板添加relationship_tracker模型配置
2025-09-19 11:28:37 +08:00
parent 3193927a76
commit 69f2ee64d9
12 changed files with 718 additions and 115 deletions
--- a/src/chat/affinity_flow/relationship_tracker.py
+++ b/src/chat/affinity_flow/relationship_tracker.py
@@ -1,13 +1,19 @@
 """
 用户关系追踪器
 负责追踪用户交互历史，并通过LLM分析更新用户关系分
+支持数据库持久化存储和回复后自动关系更新
 """
+
 import time
 from typing import Dict, List, Optional

 from src.common.logger import get_logger
 from src.config.config import model_config
 from src.llm_models.utils_model import LLMRequest
+from src.common.database.sqlalchemy_database_api import get_db_session
+from src.common.database.sqlalchemy_models import UserRelationships, Messages
+from sqlalchemy import select, desc
+from src.common.data_models.database_data_model import DatabaseMessages

 logger = get_logger("relationship_tracker")

@@ -23,16 +29,25 @@ class UserRelationshipTracker:
        self.relationship_history: List[Dict] = []
        self.interest_scoring_system = interest_scoring_system

+        # 数据库访问 - 使用SQLAlchemy
+        pass
+
+        # 用户关系缓存 (user_id -> {"relationship_text": str, "relationship_score": float, "last_tracked": float})
+        self.user_relationship_cache: Dict[str, Dict] = {}
+        self.cache_expiry_hours = 1  # 缓存过期时间(小时)
+
        # 关系更新LLM
        try:
            self.relationship_llm = LLMRequest(
-                model_set=model_config.model_task_config.relationship_tracker,
-                request_type="relationship_tracker"
+                model_set=model_config.model_task_config.relationship_tracker, request_type="relationship_tracker"
            )
        except AttributeError:
            # 如果relationship_tracker配置不存在，尝试其他可用的模型配置
-            available_models = [attr for attr in dir(model_config.model_task_config)
-                             if not attr.startswith('_') and attr != 'model_dump']
+            available_models = [
+                attr
+                for attr in dir(model_config.model_task_config)
+                if not attr.startswith("_") and attr != "model_dump"
+            ]

            if available_models:
                # 使用第一个可用的模型配置
@@ -40,14 +55,14 @@ class UserRelationshipTracker:
                logger.warning(f"relationship_tracker model configuration not found, using fallback: {fallback_model}")
                self.relationship_llm = LLMRequest(
                    model_set=getattr(model_config.model_task_config, fallback_model),
-                    request_type="relationship_tracker"
+                    request_type="relationship_tracker",
                )
            else:
                # 如果没有任何模型配置，创建一个简单的LLMRequest
                logger.warning("No model configurations found, creating basic LLMRequest")
                self.relationship_llm = LLMRequest(
                    model_set="gpt-3.5-turbo",  # 默认模型
-                    request_type="relationship_tracker"
+                    request_type="relationship_tracker",
                )

    def set_interest_scoring_system(self, interest_scoring_system):
@@ -58,8 +73,9 @@ class UserRelationshipTracker:
        """添加用户交互记录"""
        if len(self.tracking_users) >= self.max_tracking_users:
            # 移除最旧的记录
-            oldest_user = min(self.tracking_users.keys(),
-                            key=lambda k: self.tracking_users[k].get("reply_timestamp", 0))
+            oldest_user = min(
+                self.tracking_users.keys(), key=lambda k: self.tracking_users[k].get("reply_timestamp", 0)
+            )
            del self.tracking_users[oldest_user]

        # 获取当前关系分
@@ -73,7 +89,7 @@ class UserRelationshipTracker:
            "user_message": user_message,
            "bot_reply": bot_reply,
            "reply_timestamp": reply_timestamp,
-            "current_relationship_score": current_relationship_score
+            "current_relationship_score": current_relationship_score,
        }

        logger.debug(f"添加用户交互追踪: {user_id}")
@@ -101,11 +117,11 @@ class UserRelationshipTracker:
            prompt = f"""
 分析以下用户交互，更新用户关系：

-用户ID: {interaction['user_id']}
-用户名: {interaction['user_name']}
-用户消息: {interaction['user_message']}
-Bot回复: {interaction['bot_reply']}
-当前关系分: {interaction['current_relationship_score']}
+用户ID: {interaction["user_id"]}
+用户名: {interaction["user_name"]}
+用户消息: {interaction["user_message"]}
+Bot回复: {interaction["bot_reply"]}
+当前关系分: {interaction["current_relationship_score"]}

 请以JSON格式返回更新结果：
 {{
@@ -118,21 +134,30 @@ Bot回复: {interaction['bot_reply']}
            llm_response, _ = await self.relationship_llm.generate_response_async(prompt=prompt)
            if llm_response:
                import json
-                response_data = json.loads(llm_response)
-                new_score = max(0.0, min(1.0, float(response_data.get("new_relationship_score", 0.3))))

-                if self.interest_scoring_system:
-                    self.interest_scoring_system.update_user_relationship(
-                        interaction['user_id'],
-                        new_score - interaction['current_relationship_score']
-                    )
+                try:
+                    # 清理LLM响应，移除可能的格式标记
+                    cleaned_response = self._clean_llm_json_response(llm_response)
+                    response_data = json.loads(cleaned_response)
+                    new_score = max(0.0, min(1.0, float(response_data.get("new_relationship_score", 0.3))))

-                return {
-                    "user_id": interaction['user_id'],
-                    "new_relationship_score": new_score,
-                    "reasoning": response_data.get("reasoning", ""),
-                    "interaction_summary": response_data.get("interaction_summary", "")
-                }
+                    if self.interest_scoring_system:
+                        self.interest_scoring_system.update_user_relationship(
+                            interaction["user_id"], new_score - interaction["current_relationship_score"]
+                        )
+
+                    return {
+                        "user_id": interaction["user_id"],
+                        "new_relationship_score": new_score,
+                        "reasoning": response_data.get("reasoning", ""),
+                        "interaction_summary": response_data.get("interaction_summary", ""),
+                    }
+
+                except json.JSONDecodeError as e:
+                    logger.error(f"LLM响应JSON解析失败: {e}")
+                    logger.debug(f"LLM原始响应: {llm_response}")
+                except Exception as e:
+                    logger.error(f"处理关系更新数据失败: {e}")

        except Exception as e:
            logger.error(f"更新用户关系时出错: {e}")
@@ -164,10 +189,7 @@ Bot回复: {interaction['bot_reply']}

    def add_to_history(self, relationship_update: Dict):
        """添加到关系历史"""
-        self.relationship_history.append({
-            **relationship_update,
-            "update_time": time.time()
-        })
+        self.relationship_history.append({**relationship_update, "update_time": time.time()})

        # 限制历史记录数量
        if len(self.relationship_history) > 100:
@@ -198,16 +220,13 @@ Bot回复: {interaction['bot_reply']}
        if user_id in self.tracking_users:
            current_score = self.tracking_users[user_id]["current_relationship_score"]
            if self.interest_scoring_system:
-                self.interest_scoring_system.update_user_relationship(
-                    user_id,
-                    new_score - current_score
-                )
+                self.interest_scoring_system.update_user_relationship(user_id, new_score - current_score)

            update_info = {
                "user_id": user_id,
                "new_relationship_score": new_score,
                "reasoning": reasoning or "手动更新",
-                "interaction_summary": "手动更新关系分"
+                "interaction_summary": "手动更新关系分",
            }
            self.add_to_history(update_info)
            logger.info(f"强制更新用户关系: {user_id} -> {new_score:.2f}")
@@ -224,5 +243,371 @@ Bot回复: {interaction['bot_reply']}
            "current_relationship_score": interaction["current_relationship_score"],
            "interaction_count": 1,  # 简化版本，每次追踪只记录一次交互
            "last_interaction": interaction["reply_timestamp"],
-            "recent_message": interaction["user_message"][:100] + "..." if len(interaction["user_message"]) > 100 else interaction["user_message"]
-        }
+            "recent_message": interaction["user_message"][:100] + "..."
+            if len(interaction["user_message"]) > 100
+            else interaction["user_message"],
+        }
+
+    # ===== 数据库支持方法 =====
+
+    def get_user_relationship_score(self, user_id: str) -> float:
+        """获取用户关系分"""
+        # 先检查缓存
+        if user_id in self.user_relationship_cache:
+            cache_data = self.user_relationship_cache[user_id]
+            # 检查缓存是否过期
+            cache_time = cache_data.get("last_tracked", 0)
+            if time.time() - cache_time < self.cache_expiry_hours * 3600:
+                return cache_data.get("relationship_score", 0.3)
+
+        # 缓存过期或不存在，从数据库获取
+        relationship_data = self._get_user_relationship_from_db(user_id)
+        if relationship_data:
+            # 更新缓存
+            self.user_relationship_cache[user_id] = {
+                "relationship_text": relationship_data.get("relationship_text", ""),
+                "relationship_score": relationship_data.get("relationship_score", 0.3),
+                "last_tracked": time.time(),
+            }
+            return relationship_data.get("relationship_score", 0.3)
+
+        # 数据库中也没有，返回默认值
+        return 0.3
+
+    def _get_user_relationship_from_db(self, user_id: str) -> Optional[Dict]:
+        """从数据库获取用户关系数据"""
+        try:
+            with get_db_session() as session:
+                # 查询用户关系表
+                stmt = select(UserRelationships).where(UserRelationships.user_id == user_id)
+                result = session.execute(stmt).scalar_one_or_none()
+
+                if result:
+                    return {
+                        "relationship_text": result.relationship_text or "",
+                        "relationship_score": float(result.relationship_score)
+                        if result.relationship_score is not None
+                        else 0.3,
+                        "last_updated": result.last_updated,
+                    }
+        except Exception as e:
+            logger.error(f"从数据库获取用户关系失败: {e}")
+
+        return None
+
+    def _update_user_relationship_in_db(self, user_id: str, relationship_text: str, relationship_score: float):
+        """更新数据库中的用户关系"""
+        try:
+            current_time = time.time()
+
+            with get_db_session() as session:
+                # 检查是否已存在关系记录
+                existing = session.execute(
+                    select(UserRelationships).where(UserRelationships.user_id == user_id)
+                ).scalar_one_or_none()
+
+                if existing:
+                    # 更新现有记录
+                    existing.relationship_text = relationship_text
+                    existing.relationship_score = relationship_score
+                    existing.last_updated = current_time
+                    existing.user_name = existing.user_name or user_id  # 更新用户名如果为空
+                else:
+                    # 插入新记录
+                    new_relationship = UserRelationships(
+                        user_id=user_id,
+                        user_name=user_id,
+                        relationship_text=relationship_text,
+                        relationship_score=relationship_score,
+                        last_updated=current_time,
+                    )
+                    session.add(new_relationship)
+
+                session.commit()
+                logger.info(f"已更新数据库中用户关系: {user_id} -> 分数: {relationship_score:.3f}")
+
+        except Exception as e:
+            logger.error(f"更新数据库用户关系失败: {e}")
+
+    # ===== 回复后关系追踪方法 =====
+
+    async def track_reply_relationship(
+        self, user_id: str, user_name: str, bot_reply_content: str, reply_timestamp: float
+    ):
+        """回复后关系追踪 - 主要入口点"""
+        try:
+            logger.info(f"🔄 开始回复后关系追踪: {user_id}")
+
+            # 检查上次追踪时间
+            last_tracked_time = self._get_last_tracked_time(user_id)
+            time_diff = reply_timestamp - last_tracked_time
+
+            if time_diff < 5 * 60:  # 5分钟内不重复追踪
+                logger.debug(f"用户 {user_id} 距离上次追踪时间不足5分钟，跳过")
+                return
+
+            # 获取上次bot回复该用户的消息
+            last_bot_reply = await self._get_last_bot_reply_to_user(user_id)
+            if not last_bot_reply:
+                logger.debug(f"未找到上次回复用户 {user_id} 的记录")
+                return
+
+            # 获取用户后续的反应消息
+            user_reactions = await self._get_user_reactions_after_reply(user_id, last_bot_reply.time)
+
+            # 获取当前关系数据
+            current_relationship = self._get_user_relationship_from_db(user_id)
+            current_score = current_relationship.get("relationship_score", 0.3) if current_relationship else 0.3
+            current_text = current_relationship.get("relationship_text", "新用户") if current_relationship else "新用户"
+
+            # 使用LLM分析并更新关系
+            await self._analyze_and_update_relationship(
+                user_id, user_name, last_bot_reply, user_reactions, current_text, current_score, bot_reply_content
+            )
+
+        except Exception as e:
+            logger.error(f"回复后关系追踪失败: {e}")
+            logger.debug("错误详情:", exc_info=True)
+
+    def _get_last_tracked_time(self, user_id: str) -> float:
+        """获取上次追踪时间"""
+        # 先检查缓存
+        if user_id in self.user_relationship_cache:
+            return self.user_relationship_cache[user_id].get("last_tracked", 0)
+
+        # 从数据库获取
+        relationship_data = self._get_user_relationship_from_db(user_id)
+        if relationship_data:
+            return relationship_data.get("last_updated", 0)
+
+        return 0
+
+    async def _get_last_bot_reply_to_user(self, user_id: str) -> Optional[DatabaseMessages]:
+        """获取上次bot回复该用户的消息"""
+        try:
+            with get_db_session() as session:
+                # 查询bot回复给该用户的最新消息
+                stmt = (
+                    select(Messages)
+                    .where(Messages.user_id == user_id)
+                    .where(Messages.reply_to.isnot(None))
+                    .order_by(desc(Messages.time))
+                    .limit(1)
+                )
+
+                result = session.execute(stmt).scalar_one_or_none()
+                if result:
+                    # 将SQLAlchemy模型转换为DatabaseMessages对象
+                    return self._sqlalchemy_to_database_messages(result)
+
+        except Exception as e:
+            logger.error(f"获取上次回复消息失败: {e}")
+
+        return None
+
+    async def _get_user_reactions_after_reply(self, user_id: str, reply_time: float) -> List[DatabaseMessages]:
+        """获取用户在bot回复后的反应消息"""
+        try:
+            with get_db_session() as session:
+                # 查询用户在回复时间之后的5分钟内的消息
+                end_time = reply_time + 5 * 60  # 5分钟
+
+                stmt = (
+                    select(Messages)
+                    .where(Messages.user_id == user_id)
+                    .where(Messages.time > reply_time)
+                    .where(Messages.time <= end_time)
+                    .order_by(Messages.time)
+                )
+
+                results = session.execute(stmt).scalars().all()
+                if results:
+                    return [self._sqlalchemy_to_database_messages(result) for result in results]
+
+        except Exception as e:
+            logger.error(f"获取用户反应消息失败: {e}")
+
+        return []
+
+    def _sqlalchemy_to_database_messages(self, sqlalchemy_message) -> DatabaseMessages:
+        """将SQLAlchemy消息模型转换为DatabaseMessages对象"""
+        try:
+            return DatabaseMessages(
+                message_id=sqlalchemy_message.message_id or "",
+                time=float(sqlalchemy_message.time) if sqlalchemy_message.time is not None else 0.0,
+                chat_id=sqlalchemy_message.chat_id or "",
+                reply_to=sqlalchemy_message.reply_to,
+                processed_plain_text=sqlalchemy_message.processed_plain_text or "",
+                user_id=sqlalchemy_message.user_id or "",
+                user_nickname=sqlalchemy_message.user_nickname or "",
+                user_platform=sqlalchemy_message.user_platform or "",
+            )
+        except Exception as e:
+            logger.error(f"SQLAlchemy消息转换失败: {e}")
+            # 返回一个基本的消息对象
+            return DatabaseMessages(
+                message_id="",
+                time=0.0,
+                chat_id="",
+                processed_plain_text="",
+                user_id="",
+                user_nickname="",
+                user_platform="",
+            )
+
+    async def _analyze_and_update_relationship(
+        self,
+        user_id: str,
+        user_name: str,
+        last_bot_reply: DatabaseMessages,
+        user_reactions: List[DatabaseMessages],
+        current_text: str,
+        current_score: float,
+        current_reply: str,
+    ):
+        """使用LLM分析并更新用户关系"""
+        try:
+            # 构建分析提示
+            user_reactions_text = "\n".join([f"- {msg.processed_plain_text}" for msg in user_reactions])
+
+            prompt = f"""
+分析以下用户交互，更新用户关系印象和分数：
+
+用户信息:
+- 用户ID: {user_id}
+- 用户名: {user_name}
+
+上次Bot回复: {last_bot_reply.processed_plain_text}
+
+用户反应消息:
+{user_reactions_text}
+
+当前Bot回复: {current_reply}
+
+当前关系印象: {current_text}
+当前关系分数: {current_score:.3f}
+
+请根据用户的反应和对话内容，分析用户性格特点、与Bot的互动模式，然后更新关系印象和分数。
+
+分析要点:
+1. 用户的情绪态度(积极/消极/中性)
+2. 用户对Bot的兴趣程度
+3. 用户的交流风格(主动/被动/友好/正式等)
+4. 互动的质量和深度
+
+请以JSON格式返回更新结果:
+{{
+    "relationship_text": "更新的关系印象描述(50字以内)",
+    "relationship_score": 0.0~1.0的新分数,
+    "analysis_reasoning": "分析理由说明",
+    "interaction_quality": "high/medium/low"
+}}
+"""
+
+            # 调用LLM进行分析
+            llm_response, _ = await self.relationship_llm.generate_response_async(prompt=prompt)
+
+            if llm_response:
+                import json
+
+                try:
+                    # 清理LLM响应，移除可能的格式标记
+                    cleaned_response = self._clean_llm_json_response(llm_response)
+                    response_data = json.loads(cleaned_response)
+
+                    new_text = response_data.get("relationship_text", current_text)
+                    new_score = max(0.0, min(1.0, float(response_data.get("relationship_score", current_score))))
+                    reasoning = response_data.get("analysis_reasoning", "")
+                    quality = response_data.get("interaction_quality", "medium")
+
+                    # 更新数据库
+                    self._update_user_relationship_in_db(user_id, new_text, new_score)
+
+                    # 更新缓存
+                    self.user_relationship_cache[user_id] = {
+                        "relationship_text": new_text,
+                        "relationship_score": new_score,
+                        "last_tracked": time.time(),
+                    }
+
+                    # 如果有兴趣度评分系统，也更新内存中的关系分
+                    if self.interest_scoring_system:
+                        self.interest_scoring_system.update_user_relationship(user_id, new_score - current_score)
+
+                    # 记录分析历史
+                    analysis_record = {
+                        "user_id": user_id,
+                        "timestamp": time.time(),
+                        "old_score": current_score,
+                        "new_score": new_score,
+                        "old_text": current_text,
+                        "new_text": new_text,
+                        "reasoning": reasoning,
+                        "quality": quality,
+                        "user_reactions_count": len(user_reactions),
+                    }
+                    self.relationship_history.append(analysis_record)
+
+                    # 限制历史记录数量
+                    if len(self.relationship_history) > 100:
+                        self.relationship_history = self.relationship_history[-100:]
+
+                    logger.info(f"✅ 关系分析完成: {user_id}")
+                    logger.info(f"   📝 印象: '{current_text}' -> '{new_text}'")
+                    logger.info(f"   💝 分数: {current_score:.3f} -> {new_score:.3f}")
+                    logger.info(f"   🎯 质量: {quality}")
+
+                except json.JSONDecodeError as e:
+                    logger.error(f"LLM响应JSON解析失败: {e}")
+                    logger.debug(f"LLM原始响应: {llm_response}")
+            else:
+                logger.warning("LLM未返回有效响应")
+
+        except Exception as e:
+            logger.error(f"关系分析失败: {e}")
+            logger.debug("错误详情:", exc_info=True)
+
+    def _clean_llm_json_response(self, response: str) -> str:
+        """
+        清理LLM响应，移除可能的JSON格式标记
+
+        Args:
+            response: LLM原始响应
+
+        Returns:
+            清理后的JSON字符串
+        """
+        try:
+            import re
+
+            # 移除常见的JSON格式标记
+            cleaned = response.strip()
+
+            # 移除 ```json 或 ``` 等标记
+            cleaned = re.sub(r"^```(?:json)?\s*", "", cleaned, flags=re.MULTILINE | re.IGNORECASE)
+            cleaned = re.sub(r"\s*```$", "", cleaned, flags=re.MULTILINE)
+
+            # 移除可能的Markdown代码块标记
+            cleaned = re.sub(r"^`|`$", "", cleaned, flags=re.MULTILINE)
+
+            # 尝试找到JSON对象的开始和结束
+            json_start = cleaned.find("{")
+            json_end = cleaned.rfind("}")
+
+            if json_start != -1 and json_end != -1 and json_end > json_start:
+                # 提取JSON部分
+                cleaned = cleaned[json_start : json_end + 1]
+
+            # 移除多余的空白字符
+            cleaned = cleaned.strip()
+
+            logger.debug(f"LLM响应清理: 原始长度={len(response)}, 清理后长度={len(cleaned)}")
+            if cleaned != response:
+                logger.debug(f"清理前: {response[:200]}...")
+                logger.debug(f"清理后: {cleaned[:200]}...")
+
+            return cleaned
+
+        except Exception as e:
+            logger.warning(f"清理LLM响应失败: {e}")
+            return response  # 清理失败时返回原始响应