feat: 增强内存移除和图扩展功能

- 更新了`graph_store.py`中的`remove_memory`方法，以包含一个可选参数`cleanup_orphans`，用于立即清理孤立节点。 - 对`graph_expansion.py`中的图扩展算法进行了优化，具体优化措施包括： - 采用内存级广度优先搜索（BFS）遍历，而非节点级遍历。 - 批量检索邻居内存，以减少数据库调用次数。 - 早期停止机制，以避免不必要的扩展。 - 增强日志记录功能，以提高可追溯性。 - 增加了性能指标，以追踪内存扩展的效率。
2025-11-09 16:39:46 +08:00
parent a0bb9660d4
commit f4d2b54f83
5 changed files with 795 additions and 155 deletions
--- a/.github/copilot-instructions.md
+++ b/.github/copilot-instructions.md
@@ -0,0 +1,263 @@
 # MoFox_Bot AI Coding Agent Instructions
 MoFox_Bot 是基于 MaiCore 的增强型 QQ 聊天机器人，集成了 LLM、插件系统、记忆图谱、情感系统等高级特性。本指南帮助 AI 代理快速理解项目架构并高效开发。
 ## 🏗️ 核心架构
 ### 应用启动流程
 - **入口点**: `bot.py` → `src/main.py` 的 `MainSystem` 类
 - **启动顺序**: EULA 检查 → 数据库初始化 → 插件加载 → 组件初始化 → WebUI 启动（可选）
 - **关键管理器**: 所有管理器通过单例模式获取（如 `get_xxx_manager()`）
 ### 六层数据库架构
 项目在 2025年11月重构了完整的数据库层，采用 **SQLAlchemy 2.0**：
 1. **Core Layer** (`src/common/database/core.py`): `DatabaseEngine` 单例、WAL 模式 SQLite、连接池管理
 2. **API Layer** (`src/common/database/api/`): `CRUDBase` 通用 CRUD、`QueryBuilder` 链式查询、`specialized.py` 业务特化 API
 3. **Optimization Layer** (`src/common/database/optimization/`): 3级缓存 (L1内存/L2 SQLite/L3预加载)、`IntelligentPreloader`、`AdaptiveBatchScheduler`
 4. **Config Layer** (`src/common/database/config/`): 数据库/缓存/预加载器配置
 5. **Utils Layer** (`src/common/database/utils/`): 装饰器（重试、超时、缓存）、性能监控
 6. **Compatibility Layer** (`src/common/database/compatibility/`): 向后兼容旧 API（`db_query`、`db_save` 等）
 **关键原则**:
 - ✅ 新代码使用 `CRUDBase` 或 `QueryBuilder`
 - ✅ 批量操作使用 `AdaptiveBatchScheduler`
 - ⚠️ 避免直接使用 `Session`，使用提供的 API 层
 - ⚠️ 数据模型在 `src/common/database/sqlalchemy_models.py` 统一定义
 ### 插件系统架构
 **核心概念**: 组件化设计，插件包含多个可注册组件
 **组件类型** (`src/plugin_system/base/component_types.py`):
 - `ACTION`: 主动/被动行为（回复、发送表情、禁言等）
 - `COMMAND`: 命令处理（传统 `/` 前缀命令）
 - `PLUS_COMMAND`: 增强命令（支持参数解析、权限检查）
 - `TOOL`: LLM 工具调用（函数调用集成）
 - `EVENT_HANDLER`: 事件订阅处理器
 - `INTEREST_CALCULATOR`: 兴趣值计算器
 - `PROMPT`: 自定义提示词注入
 **插件开发流程**:
 1. 在 `plugins/` 下创建目录，编写 `_manifest.json`
 2. 创建 `plugin.py`，继承 `BasePlugin` 或 `PlusPlugin`
 3. 使用 `@register_plugin` 装饰器注册
 4. 实现 `get_plugin_components()` 返回组件列表
 5. 组件通过 `ComponentRegistry` 自动注册
 **示例结构**:
 ```python
 from src.plugin_system import BasePlugin, register_plugin, BaseAction
@register_plugin
 class MyPlugin(BasePlugin):
    plugin_name = "my_plugin"
    enable_plugin = True
    def get_plugin_components(self):
        return [(ActionInfo(...), MyAction)]
 ```
 **关键 API** (`src/plugin_system/apis/`):
 - `chat_api`: 聊天功能（获取消息、发送消息）
 - `database_api`: 数据库操作（推荐使用新 API）
 - `llm_api`: LLM 交互（模型调用、工具注册）
 - `permission_api`: 权限管理（检查权限、节点操作）
 - `component_manage_api`: 组件查询与管理
 ### 统一调度器（Unified Scheduler）
 **位置**: `src/schedule/unified_scheduler.py`
 **触发类型**:
 - `TIME`: 延迟触发（`delay_seconds`）或指定时间（`trigger_at`）
 - `EVENT`: 事件触发（基于 `event_manager`）
 - `CUSTOM`: 自定义条件函数
 **使用模式**:
 ```python
 from src.schedule.unified_scheduler import unified_scheduler, TriggerType
 await unified_scheduler.create_schedule(
    callback=my_async_function,
    trigger_type=TriggerType.TIME,
    trigger_config={"delay_seconds": 30},
    is_recurring=True,
    task_name="periodic_task"
 )
 ```
 ⚠️ **自动启动**: 调度器在 `MainSystem.initialize()` 中自动启动，无需手动初始化
 ### 记忆系统架构
 **双轨记忆**:
 - **Memory Graph** (`src/memory_graph/`): 基于图的持久记忆（人物、事件、关系）
 - **Chat Memory** (`src/chat/memory_system/`): 会话上下文记忆
 **兴趣值系统** (`src/chat/interest_system/`):
 - 通过插件自动注册 `InterestCalculator` 组件
 - 支持主题聚类、时间衰减、动态权重
 - 影响 AFC (Affinity Flow Chatter) 对话策略
 **关系系统** (`src/person_info/`):
 - 亲密度值影响回复风格和语气
 - 与兴趣值系统协同工作
 ## 🛠️ 开发工作流
 ### 环境管理
 **首选**: `uv` 包管理器（配置清华镜像）
 ```powershell
 uv venv
 uv pip install -r requirements.txt
 ```
 **环境配置**:
 1. 复制 `template/template.env` → `.env`
 2. 设置 `EULA_CONFIRMED=true`
 3. 编辑 `config/bot_config.toml` 和 `config/model_config.toml`
 ### 代码质量
 **Linter**: Ruff（配置在 `pyproject.toml`）
 ```powershell
 ruff check .      # 检查
 ruff format .     # 格式化
 ```
 **规范**:
 - 行长度: 120 字符
 - 引号: 双引号
 - 类型提示: 推荐使用（尤其是公共 API）
 - 异步优先: 所有 I/O 操作使用 `async/await`
 ### 日志系统
 **位置**: `src/common/logger.py`
 **使用模式**:
 ```python
 from src.common.logger import get_logger
 logger = get_logger("module_name")
 logger.info("信息")
 logger.error("错误", exc_info=True)  # 包含堆栈跟踪
 ```
 **日志级别**: 通过 `bot_config.toml` 的 `[logging]` 配置
 ### 运行与调试
 **启动命令**:
 ```powershell
 python bot.py              # 标准启动
 python __main__.py         # 备用入口
 ```
 **WebUI 开发**:
 - WebUI 位于同级目录 `webui/` 或 `../webui`
 - 自动通过 `npm run dev` 启动（可在 `.env` 设置 `WEBUI_DIR`）
 - 超时 60 秒检测是否成功
 **调试技巧**:
 - 检查 `logs/app_*.jsonl` 结构化日志
 - 使用 `get_errors()` 工具查看编译错误
 - 数据库问题：查看 `data/MaiBot.db`（SQLite）或 MySQL 连接
 ## 📋 关键约定与模式
 ### 配置管理
 **全局配置**: `src/config/config.py` 的 `global_config` 单例
 - 通过 TOML 文件驱动（`config/bot_config.toml`）
 - 支持环境变量覆盖（`.env`）
 - 数据库类型切换：`database.database_type = "sqlite" | "mysql"`
 ### 事件系统
 **Event Manager** (`src/plugin_system/core/event_manager.py`):
 ```python
 from src.plugin_system.core.event_manager import event_manager
 from src.plugin_system.base.component_types import EventType
 await event_manager.trigger_event(
    EventType.ON_MESSAGE_RECEIVED,
    message_data=data,
    permission_group="USER"
 )
 ```
 **常用事件**:
 - `ON_START` / `ON_STOP`: 系统生命周期
 - `ON_MESSAGE_RECEIVED`: 消息接收
 - `ON_PLUGIN_LOADED` / `ON_PLUGIN_UNLOADED`: 插件生命周期
 ### 消息处理
 **核心类**: `ChatBot` (`src/chat/message_receive/bot.py`)
 - 消息通过 `_message_process_wrapper` 异步并行处理
 - 使用 `MessageStorageBatcher` 批量存储（`src/chat/message_receive/storage.py`）
 - 消息分块重组: `MessageReassembler` (`src/utils/message_chunker.py`)
 ### 批量操作最佳实践
 **场景**: 需要保存大量数据库记录
 ```python
 from src.common.database.optimization.batch_scheduler import get_batch_scheduler
 scheduler = get_batch_scheduler()
 await scheduler.schedule_batch_insert(model_class, data_list)
 ```
 ### 权限系统
 **检查权限**:
 ```python
 from src.plugin_system.apis.permission_api import permission_api
 has_permission = await permission_api.check_permission(
    user_id="123456",
    platform="qq",
    permission_node="plugin.my_plugin.admin"
 )
 ```
 **Master 用户**: 在 `bot_config.toml` 的 `[permission.master_users]` 配置
 ## 🔍 常见问题与陷阱
 ### 数据库相关
 ❌ **错误**: 直接创建 `Session` 对象
 ✅ **正确**: 使用 `CRUDBase` 或 `QueryBuilder` API
 ❌ **错误**: 循环中逐条插入
 ✅ **正确**: 使用 `AdaptiveBatchScheduler` 批量插入
 ### 插件开发
 ❌ **错误**: 在 `__init__` 中执行异步操作
 ✅ **正确**: 在 `on_plugin_loaded()` 中执行异步初始化
 ❌ **错误**: 硬编码配置值
 ✅ **正确**: 使用 `self.plugin_config` 读取配置
 ### 性能优化
 ⚠️ **避免**: 在主事件循环中阻塞 I/O
 ✅ **使用**: `asyncio.to_thread()` 或 `loop.run_in_executor()`
 ⚠️ **避免**: 频繁的小查询
 ✅ **使用**: 预加载、缓存或批量查询
 ## 📚 关键文档参考
 - **插件开发**: `docs/plugins/quick-start.md`
 - **数据库架构**: `docs/database_refactoring_completion.md`
 - **统一调度器**: `docs/unified_scheduler_guide.md`
 - **记忆图谱**: `docs/memory_graph_guide.md`
 - **部署指南**: `docs/deployment_guide.md`
 - **配置说明**: 在线文档 https://mofox-studio.github.io/MoFox-Bot-Docs/
 ## 🎯 快速定位关键文件
 | 功能域 | 入口文件 |
 |--------|----------|
 | 主系统 | `src/main.py` |
 | 插件管理器 | `src/plugin_system/core/plugin_manager.py` |
 | 数据库 API | `src/common/database/api/crud.py` |
 | 消息处理 | `src/chat/message_receive/bot.py` |
 | LLM 集成 | `src/llm_models/model_client/` |
 | 配置系统 | `src/config/config.py` |
 | 日志系统 | `src/common/logger.py` |
 ---
 **项目特色**: 本项目集成了 MCP (Model Context Protocol) 支持、Affinity Flow Chatter 智能对话、视频分析、日程管理等独特功能。探索 `src/plugins/built_in/` 查看内置插件示例。
--- a/src/memory_graph/core/builder.py
+++ b/src/memory_graph/core/builder.py
@@ -126,6 +126,9 @@ class MemoryBuilder:
                edges.extend(attr_edges)
            # 6. 构建 Memory 对象
            # 新记忆应该有较高的初始激活度
            initial_activation = 0.75  # 新记忆初始激活度为 0.75
            memory = Memory(
                id=memory_id,
                subject_id=subject_node.id,
@@ -133,6 +136,7 @@ class MemoryBuilder:
                nodes=nodes,
                edges=edges,
                importance=extracted_params["importance"],
                activation=initial_activation,  # 设置较高的初始激活度
                created_at=extracted_params["timestamp"],
                last_accessed=extracted_params["timestamp"],
                access_count=0,
@@ -140,6 +144,12 @@ class MemoryBuilder:
                metadata={
                    "subject": extracted_params["subject"],
                    "topic": extracted_params["topic"],
                    "activation": {
                        "level": initial_activation,
                        "last_access": extracted_params["timestamp"].isoformat(),
                        "access_count": 0,
                        "created_at": extracted_params["timestamp"].isoformat(),
                    },
                },
            )
--- a/src/memory_graph/manager.py
+++ b/src/memory_graph/manager.py
@@ -78,7 +78,7 @@ class MemoryManager:
        self._last_maintenance = datetime.now()
        self._maintenance_task: asyncio.Task | None = None
        self._maintenance_interval_hours = getattr(self.config, "consolidation_interval_hours", 1.0)
-        self._maintenance_schedule_id: str | None = None  # 调度任务ID
+        self._maintenance_running = False  # 维护任务运行状态
        logger.info(f"记忆管理器已创建 (data_dir={self.data_dir}, enable={getattr(self.config, 'enable', False)})")
@@ -155,8 +155,8 @@ class MemoryManager:
            self._initialized = True
            logger.info("✅ 记忆管理器初始化完成")
-            # 启动后台维护调度任务
+            # 启动后台维护任务
-            await self.start_maintenance_scheduler()
+            self._start_maintenance_task()
        except Exception as e:
            logger.error(f"记忆管理器初始化失败: {e}", exc_info=True)
@@ -178,8 +178,8 @@ class MemoryManager:
        try:
            logger.info("正在关闭记忆管理器...")
-            # 1. 停止调度任务
+            # 1. 停止维护任务
-            await self.stop_maintenance_scheduler()
+            await self._stop_maintenance_task()
            # 2. 执行最后一次维护（保存数据）
            if self.graph_store and self.persistence:
@@ -867,12 +867,19 @@ class MemoryManager:
            max_expanded=max_expanded,
        )
-    async def forget_memory(self, memory_id: str) -> bool:
+    async def forget_memory(self, memory_id: str, cleanup_orphans: bool = True) -> bool:
        """
-        遗忘记忆（标记为已遗忘，不删除）
+        遗忘记忆（直接删除）
        这个方法会：
        1. 从向量存储中删除节点的嵌入向量
        2. 从图存储中删除记忆
        3. 可选：清理孤立节点（建议批量遗忘后统一清理）
        4. 保存更新后的数据
        Args:
            memory_id: 记忆 ID
            cleanup_orphans: 是否立即清理孤立节点（默认True，批量遗忘时设为False）
        Returns:
            是否遗忘成功
@@ -886,13 +893,36 @@ class MemoryManager:
                logger.warning(f"记忆不存在: {memory_id}")
                return False
-            memory.metadata["forgotten"] = True
+            # 1. 从向量存储删除节点的嵌入向量
-            memory.metadata["forgotten_at"] = datetime.now().isoformat()
+            deleted_vectors = 0
            for node in memory.nodes:
                if node.embedding is not None:
                    try:
                        await self.vector_store.delete_node(node.id)
                        deleted_vectors += 1
                    except Exception as e:
                        logger.warning(f"删除节点向量失败 {node.id}: {e}")
-            # 保存更新
+            # 2. 从图存储删除记忆
            success = self.graph_store.remove_memory(memory_id, cleanup_orphans=False)
            if success:
                # 3. 可选：清理孤立节点
                if cleanup_orphans:
                    orphan_nodes, orphan_edges = await self._cleanup_orphan_nodes_and_edges()
                    logger.info(
                        f"记忆已遗忘并删除: {memory_id} "
                        f"(删除了 {deleted_vectors} 个向量, 清理了 {orphan_nodes} 个孤立节点, {orphan_edges} 条孤立边)"
                    )
                else:
                    logger.debug(f"记忆已删除: {memory_id} (删除了 {deleted_vectors} 个向量)")
                # 4. 保存更新
                await self.persistence.save_graph_store(self.graph_store)
            logger.info(f"记忆已遗忘: {memory_id}")
                return True
            else:
                logger.error(f"从图存储删除记忆失败: {memory_id}")
                return False
        except Exception as e:
            logger.error(f"遗忘记忆失败: {e}", exc_info=True)
@@ -900,7 +930,12 @@ class MemoryManager:
    async def auto_forget_memories(self, threshold: float = 0.1) -> int:
        """
-        自动遗忘低激活度的记忆
+        自动遗忘低激活度的记忆（批量优化版）
        应用时间衰减公式计算当前激活度，低于阈值则遗忘。
        衰减公式：activation = base_activation * (decay_rate ^ days_passed)
        优化：批量删除记忆后统一清理孤立节点，减少重复检查
        Args:
            threshold: 激活度阈值
@@ -915,40 +950,144 @@ class MemoryManager:
            forgotten_count = 0
            all_memories = self.graph_store.get_all_memories()
            # 获取配置参数
            min_importance = getattr(self.config, "forgetting_min_importance", 0.8)
            decay_rate = getattr(self.config, "activation_decay_rate", 0.9)
            # 收集需要遗忘的记忆ID
            memories_to_forget = []
            for memory in all_memories:
                # 跳过已遗忘的记忆
                if memory.metadata.get("forgotten", False):
                    continue
-                # 跳过高重要性记忆
+                # 跳过高重要性记忆（保护重要记忆不被遗忘）
                min_importance = getattr(self.config, "forgetting_min_importance", 7.0)
                if memory.importance >= min_importance:
                    continue
-                # 计算当前激活度
+                # 计算当前激活度（应用时间衰减）
                activation_info = memory.metadata.get("activation", {})
                base_activation = activation_info.get("level", memory.activation)
                last_access = activation_info.get("last_access")
                if last_access:
                    try:
                        last_access_dt = datetime.fromisoformat(last_access)
                        days_passed = (datetime.now() - last_access_dt).days
-                    # 长时间未访问的记忆，应用时间衰减
+                        # 应用指数衰减：activation = base * (decay_rate ^ days)
-                    decay_factor = 0.9 ** days_passed
+                        current_activation = base_activation * (decay_rate ** days_passed)
                    current_activation = activation_info.get("level", 0.0) * decay_factor
-                    # 低于阈值则遗忘
+                        logger.debug(
                            f"记忆 {memory.id[:8]}: 基础激活度={base_activation:.3f}, "
                            f"经过{days_passed}天衰减后={current_activation:.3f}"
                        )
                    except (ValueError, TypeError) as e:
                        logger.warning(f"解析时间失败: {e}, 使用基础激活度")
                        current_activation = base_activation
                else:
                    # 没有访问记录，使用基础激活度
                    current_activation = base_activation
                # 低于阈值则标记为待遗忘
                if current_activation < threshold:
-                        await self.forget_memory(memory.id)
+                    memories_to_forget.append((memory.id, current_activation))
                    logger.debug(
                        f"标记遗忘 {memory.id[:8]}: 激活度={current_activation:.3f} < 阈值={threshold:.3f}"
                    )
            # 批量遗忘记忆（不立即清理孤立节点）
            if memories_to_forget:
                logger.info(f"开始批量遗忘 {len(memories_to_forget)} 条记忆...")
                for memory_id, activation in memories_to_forget:
                    # cleanup_orphans=False：暂不清理孤立节点
                    success = await self.forget_memory(memory_id, cleanup_orphans=False)
                    if success:
                        forgotten_count += 1
-            logger.info(f"自动遗忘完成: 遗忘了 {forgotten_count} 条记忆")
+                # 统一清理孤立节点和边
                logger.info("批量遗忘完成，开始统一清理孤立节点和边...")
                orphan_nodes, orphan_edges = await self._cleanup_orphan_nodes_and_edges()
                # 保存最终更新
                await self.persistence.save_graph_store(self.graph_store)
                logger.info(
                    f"✅ 自动遗忘完成: 遗忘了 {forgotten_count} 条记忆, "
                    f"清理了 {orphan_nodes} 个孤立节点, {orphan_edges} 条孤立边"
                )
            else:
                logger.info("✅ 自动遗忘完成: 没有需要遗忘的记忆")
            return forgotten_count
        except Exception as e:
            logger.error(f"自动遗忘失败: {e}", exc_info=True)
            return 0
    async def _cleanup_orphan_nodes_and_edges(self) -> tuple[int, int]:
        """
        清理孤立节点和边
        孤立节点：不再属于任何记忆的节点
        孤立边：连接到已删除节点的边
        Returns:
            (清理的孤立节点数, 清理的孤立边数)
        """
        try:
            orphan_nodes_count = 0
            orphan_edges_count = 0
            # 1. 清理孤立节点
            # graph_store.node_to_memories 记录了每个节点属于哪些记忆
            nodes_to_remove = []
            for node_id, memory_ids in list(self.graph_store.node_to_memories.items()):
                # 如果节点不再属于任何记忆，标记为删除
                if not memory_ids:
                    nodes_to_remove.append(node_id)
            # 从图中删除孤立节点
            for node_id in nodes_to_remove:
                if self.graph_store.graph.has_node(node_id):
                    self.graph_store.graph.remove_node(node_id)
                    orphan_nodes_count += 1
                # 从映射中删除
                if node_id in self.graph_store.node_to_memories:
                    del self.graph_store.node_to_memories[node_id]
            # 2. 清理孤立边（指向已删除节点的边）
            edges_to_remove = []
            for source, target, edge_id in self.graph_store.graph.edges(data='edge_id'):
                # 检查边的源节点和目标节点是否还存在于node_to_memories中
                if source not in self.graph_store.node_to_memories or \
                   target not in self.graph_store.node_to_memories:
                    edges_to_remove.append((source, target))
            # 删除孤立边
            for source, target in edges_to_remove:
                try:
                    self.graph_store.graph.remove_edge(source, target)
                    orphan_edges_count += 1
                except Exception as e:
                    logger.debug(f"删除边失败 {source} -> {target}: {e}")
            if orphan_nodes_count > 0 or orphan_edges_count > 0:
                logger.info(
                    f"清理完成: {orphan_nodes_count} 个孤立节点, {orphan_edges_count} 条孤立边"
                )
            return orphan_nodes_count, orphan_edges_count
        except Exception as e:
            logger.error(f"清理孤立节点和边失败: {e}", exc_info=True)
            return 0, 0
    # ==================== 统计与维护 ====================
    def get_statistics(self) -> dict[str, Any]:
@@ -1043,7 +1182,14 @@ class MemoryManager:
        max_batch_size: int,
    ) -> None:
        """
-        后台执行记忆整理的具体实现
+        后台执行记忆整理的具体实现 (完整版)
        流程：
        1. 获取时间窗口内的记忆
        2. 重要性过滤
        3. 向量检索关联记忆
        4. 分批交给LLM分析关系
        5. 统一更新记忆数据
        这个方法会在独立任务中运行，不阻塞主流程
        """
@@ -1052,9 +1198,11 @@ class MemoryManager:
                "merged_count": 0,
                "checked_count": 0,
                "skipped_count": 0,
                "linked_count": 0,
                "importance_filtered": 0,
            }
-            # 获取最近创建的记忆
+            # ===== 步骤1: 获取时间窗口内的记忆 =====
            cutoff_time = datetime.now() - timedelta(hours=time_window_hours)
            all_memories = self.graph_store.get_all_memories()
@@ -1067,18 +1215,37 @@ class MemoryManager:
                logger.info("✅ 记忆整理完成: 没有需要整理的记忆")
                return
            logger.info(f"📋 步骤1: 找到 {len(recent_memories)} 条时间窗口内的记忆")
            # ===== 步骤2: 重要性过滤 =====
            min_importance_for_consolidation = getattr(self.config, "consolidation_min_importance", 0.3)
            important_memories = [
                mem for mem in recent_memories
                if mem.importance >= min_importance_for_consolidation
            ]
            result["importance_filtered"] = len(recent_memories) - len(important_memories)
            logger.info(
                f"📊 步骤2: 重要性过滤 (阈值={min_importance_for_consolidation:.2f}): "
                f"{len(recent_memories)} → {len(important_memories)} 条记忆"
            )
            if not important_memories:
                logger.info("✅ 记忆整理完成: 没有重要的记忆需要整理")
                return
            # 限制批量处理数量
-            if len(recent_memories) > max_batch_size:
+            if len(important_memories) > max_batch_size:
-                logger.info(f"📊 记忆数量 {len(recent_memories)} 超过批量限制 {max_batch_size}，仅处理最新的 {max_batch_size} 条")
+                logger.info(f"📊 记忆数量 {len(important_memories)} 超过批量限制 {max_batch_size}，仅处理最新的 {max_batch_size} 条")
-                recent_memories = sorted(recent_memories, key=lambda m: m.created_at, reverse=True)[:max_batch_size]
+                important_memories = sorted(important_memories, key=lambda m: m.created_at, reverse=True)[:max_batch_size]
-                result["skipped_count"] = len(all_memories) - max_batch_size
+                result["skipped_count"] = len(important_memories) - max_batch_size
-            logger.info(f"📋 找到 {len(recent_memories)} 条待整理记忆")
+            result["checked_count"] = len(important_memories)
            result["checked_count"] = len(recent_memories)
            # ===== 步骤3: 去重（相似记忆合并）=====
            # 按记忆类型分组，减少跨类型比较
            memories_by_type: dict[str, list[Memory]] = {}
-            for mem in recent_memories:
+            for mem in important_memories:
                mem_type = mem.metadata.get("memory_type", "")
                if mem_type not in memories_by_type:
                    memories_by_type[mem_type] = []
@@ -1088,7 +1255,8 @@ class MemoryManager:
            to_delete: list[tuple[Memory, str]] = []  # (memory, reason)
            deleted_ids = set()
-            # 对每个类型的记忆进行相似度检测
+            # 对每个类型的记忆进行相似度检测（去重）
            logger.info("📍 步骤3: 开始相似记忆去重...")
            for mem_type, memories in memories_by_type.items():
                if len(memories) < 2:
                    continue
@@ -1106,7 +1274,6 @@ class MemoryManager:
                        valid_memories.append(mem)
                # 批量计算相似度矩阵（比逐个计算更高效）
                for i in range(len(valid_memories)):
                    # 更频繁的协作式多任务让出
                    if i % 5 == 0:
@@ -1158,7 +1325,7 @@ class MemoryManager:
            # 批量删除标记的记忆
            if to_delete:
-                logger.info(f"🗑️ 开始批量删除 {len(to_delete)} 条相似记忆")
+                logger.info(f"🗑️ 批量删除 {len(to_delete)} 条相似记忆")
                for memory, reason in to_delete:
                    try:
@@ -1175,7 +1342,118 @@ class MemoryManager:
                # 批量保存（一次性写入，减少I/O）
                await self.persistence.save_graph_store(self.graph_store)
-                logger.info("💾 批量保存完成")
+                logger.info("💾 去重保存完成")
            # ===== 步骤4: 向量检索关联记忆 + LLM分析关系 =====
            # 过滤掉已删除的记忆
            remaining_memories = [m for m in important_memories if m.id not in deleted_ids]
            if not remaining_memories:
                logger.info("✅ 记忆整理完成: 去重后无剩余记忆")
                return
            logger.info(f"📍 步骤4: 开始关联分析 ({len(remaining_memories)} 条记忆)...")
            # 分批处理记忆关联
            llm_batch_size = getattr(self.config, "consolidation_llm_batch_size", 10)
            max_candidates_per_memory = getattr(self.config, "consolidation_max_candidates", 5)
            min_confidence = getattr(self.config, "consolidation_min_confidence", 0.6)
            all_new_edges = []  # 收集所有新建的边
            for batch_start in range(0, len(remaining_memories), llm_batch_size):
                batch_end = min(batch_start + llm_batch_size, len(remaining_memories))
                batch = remaining_memories[batch_start:batch_end]
                logger.debug(f"处理批次 {batch_start//llm_batch_size + 1}/{(len(remaining_memories)-1)//llm_batch_size + 1}")
                for memory in batch:
                    # 跳过已经有很多连接的记忆
                    existing_edges = len([
                        e for e in memory.edges
                        if e.edge_type == EdgeType.RELATION
                    ])
                    if existing_edges >= 10:
                        continue
                    # 使用向量搜索找候选关联记忆
                    candidates = await self._find_link_candidates(
                        memory,
                        exclude_ids={memory.id} | deleted_ids,
                        max_results=max_candidates_per_memory
                    )
                    if not candidates:
                        continue
                    # 使用LLM分析关系
                    relations = await self._analyze_memory_relations(
                        source_memory=memory,
                        candidate_memories=candidates,
                        min_confidence=min_confidence
                    )
                    # 建立关联边
                    for relation in relations:
                        try:
                            # 创建关联边
                            edge = MemoryEdge(
                                id=f"edge_{uuid.uuid4().hex[:12]}",
                                source_id=memory.subject_id,
                                target_id=relation["target_memory"].subject_id,
                                relation=relation["relation_type"],
                                edge_type=EdgeType.RELATION,
                                importance=relation["confidence"],
                                metadata={
                                    "auto_linked": True,
                                    "confidence": relation["confidence"],
                                    "reasoning": relation["reasoning"],
                                    "created_at": datetime.now().isoformat(),
                                    "created_by": "consolidation",
                                }
                            )
                            all_new_edges.append((memory, edge, relation))
                            result["linked_count"] += 1
                        except Exception as e:
                            logger.warning(f"创建关联边失败: {e}")
                            continue
                # 每个批次后让出控制权
                await asyncio.sleep(0.01)
            # ===== 步骤5: 统一更新记忆数据 =====
            if all_new_edges:
                logger.info(f"📍 步骤5: 统一更新 {len(all_new_edges)} 条新关联边...")
                for memory, edge, relation in all_new_edges:
                    try:
                        # 添加到图
                        self.graph_store.graph.add_edge(
                            edge.source_id,
                            edge.target_id,
                            edge_id=edge.id,
                            relation=edge.relation,
                            edge_type=edge.edge_type.value,
                            importance=edge.importance,
                            metadata=edge.metadata,
                        )
                        # 同时添加到记忆的边列表
                        memory.edges.append(edge)
                        logger.debug(
                            f"✓ {memory.id[:8]} --[{relation['relation_type']}]--> "
                            f"{relation['target_memory'].id[:8]} (置信度={relation['confidence']:.2f})"
                        )
                    except Exception as e:
                        logger.warning(f"添加边到图失败: {e}")
                # 批量保存更新
                await self.persistence.save_graph_store(self.graph_store)
                logger.info("💾 关联边保存完成")
            logger.info(f"✅ 记忆整理完成: {result}")
@@ -1917,11 +2195,11 @@ class MemoryManager:
            logger.error(f"LLM批量关系分析失败: {e}", exc_info=True)
            return []
-    async def start_maintenance_scheduler(self) -> None:
+    def _start_maintenance_task(self) -> None:
        """
-        启动记忆维护调度任务
+        启动记忆维护后台任务
-        使用 unified_scheduler 定期执行维护任务：
+        直接创建async task，避免使用scheduler阻塞主程序：
        - 记忆整合（合并相似记忆）
        - 自动遗忘低激活度记忆
        - 保存数据
@@ -1929,57 +2207,96 @@ class MemoryManager:
        默认间隔：1小时
        """
        try:
-            from src.schedule.unified_scheduler import TriggerType, unified_scheduler
+            # 如果已有维护任务，先停止
            if self._maintenance_task and not self._maintenance_task.done():
                self._maintenance_task.cancel()
                logger.info("取消旧的维护任务")
-            # 如果已有调度任务，先移除
+            # 创建新的后台维护任务
-            if self._maintenance_schedule_id:
+            self._maintenance_task = asyncio.create_task(
-                await unified_scheduler.remove_schedule(self._maintenance_schedule_id)
+                self._maintenance_loop(),
-                logger.info("移除旧的维护调度任务")
+                name="memory_maintenance_loop"
            # 创建新的调度任务
            interval_seconds = self._maintenance_interval_hours * 3600
            self._maintenance_schedule_id = await unified_scheduler.create_schedule(
                callback=self.maintenance,
                trigger_type=TriggerType.TIME,
                trigger_config={
                    "delay_seconds": interval_seconds,  # 首次延迟（启动后1小时）
                    "interval_seconds": interval_seconds,  # 循环间隔
                },
                is_recurring=True,
                task_name="memory_maintenance",
            )
            logger.info(
-                f"✅ 记忆维护调度任务已启动 "
+                f"✅ 记忆维护后台任务已启动 "
-                f"(间隔={self._maintenance_interval_hours}小时, "
+                f"(间隔={self._maintenance_interval_hours}小时)"
                f"schedule_id={self._maintenance_schedule_id[:8]}...)"
            )
        except ImportError:
            logger.warning("无法导入 unified_scheduler，维护调度功能不可用")
        except Exception as e:
-            logger.error(f"启动维护调度任务失败: {e}", exc_info=True)
+            logger.error(f"启动维护后台任务失败: {e}", exc_info=True)
-    async def stop_maintenance_scheduler(self) -> None:
+    async def _stop_maintenance_task(self) -> None:
        """
-        停止记忆维护调度任务
+        停止记忆维护后台任务
        """
-        if not self._maintenance_schedule_id:
+        if not self._maintenance_task or self._maintenance_task.done():
            return
        try:
-            from src.schedule.unified_scheduler import unified_scheduler
+            self._maintenance_running = False  # 设置停止标志
            self._maintenance_task.cancel()
-            success = await unified_scheduler.remove_schedule(self._maintenance_schedule_id)
+            try:
-            if success:
+                await self._maintenance_task
-                logger.info(f"✅ 记忆维护调度任务已停止 (schedule_id={self._maintenance_schedule_id[:8]}...)")
+            except asyncio.CancelledError:
-            else:
+                logger.debug("维护任务已取消")
                logger.warning(f"停止维护调度任务失败 (schedule_id={self._maintenance_schedule_id[:8]}...)")
-            self._maintenance_schedule_id = None
+            logger.info("✅ 记忆维护后台任务已停止")
            self._maintenance_task = None
        except ImportError:
            logger.warning("无法导入 unified_scheduler")
        except Exception as e:
-            logger.error(f"停止维护调度任务失败: {e}", exc_info=True)
+            logger.error(f"停止维护后台任务失败: {e}", exc_info=True)
    async def _maintenance_loop(self) -> None:
        """
        记忆维护循环
        在后台独立运行，定期执行维护任务，避免阻塞主程序
        """
        self._maintenance_running = True
        try:
            # 首次执行延迟（启动后1小时）
            initial_delay = self._maintenance_interval_hours * 3600
            logger.debug(f"记忆维护任务将在 {initial_delay} 秒后首次执行")
            while self._maintenance_running:
                try:
                    # 使用 asyncio.wait_for 来支持取消
                    await asyncio.wait_for(
                        asyncio.sleep(initial_delay),
                        timeout=float('inf')  # 允许随时取消
                    )
                    # 检查是否仍然需要运行
                    if not self._maintenance_running:
                        break
                    # 执行维护任务（使用try-catch避免崩溃）
                    try:
                        await self.maintenance()
                    except Exception as e:
                        logger.error(f"维护任务执行失败: {e}", exc_info=True)
                    # 后续执行使用相同间隔
                    initial_delay = self._maintenance_interval_hours * 3600
                except asyncio.CancelledError:
                    logger.debug("维护循环被取消")
                    break
                except Exception as e:
                    logger.error(f"维护循环发生异常: {e}", exc_info=True)
                    # 异常后等待较短时间再重试
                    try:
                        await asyncio.sleep(300)  # 5分钟后重试
                    except asyncio.CancelledError:
                        break
        except asyncio.CancelledError:
            logger.debug("维护循环完全退出")
        except Exception as e:
            logger.error(f"维护循环意外结束: {e}", exc_info=True)
        finally:
            self._maintenance_running = False
            logger.debug("维护循环已清理完毕")
--- a/src/memory_graph/storage/graph_store.py
+++ b/src/memory_graph/storage/graph_store.py
@@ -459,12 +459,13 @@ class GraphStore:
        logger.info("已将图中的边同步到 Memory.edges（保证 graph 与 memory 对象一致）")
-    def remove_memory(self, memory_id: str) -> bool:
+    def remove_memory(self, memory_id: str, cleanup_orphans: bool = True) -> bool:
        """
        从图中删除指定记忆
        Args:
            memory_id: 要删除的记忆ID
            cleanup_orphans: 是否立即清理孤立节点（默认True，批量删除时设为False）
        Returns:
            是否删除成功
@@ -481,6 +482,9 @@ class GraphStore:
            for node in memory.nodes:
                if node.id in self.node_to_memories:
                    self.node_to_memories[node.id].discard(memory_id)
                    # 可选：立即清理孤立节点
                    if cleanup_orphans:
                        # 如果该节点不再属于任何记忆，从图中移除节点
                        if not self.node_to_memories[node.id]:
                            if self.graph.has_node(node.id):
@@ -490,7 +494,7 @@ class GraphStore:
            # 3. 从记忆索引中移除
            del self.memory_index[memory_id]
-            logger.info(f"成功删除记忆: {memory_id}")
+            logger.debug(f"成功删除记忆: {memory_id}")
            return True
        except Exception as e:
--- a/src/memory_graph/utils/graph_expansion.py
+++ b/src/memory_graph/utils/graph_expansion.py
@@ -1,9 +1,15 @@
 """
-图扩展工具
+图扩展工具（优化版）
-提供记忆图的扩展算法，用于从初始记忆集合沿图结构扩展查找相关记忆
+提供记忆图的扩展算法，用于从初始记忆集合沿图结构扩展查找相关记忆。
 优化重点：
 1. 改进BFS遍历效率
 2. 批量向量检索，减少数据库调用
 3. 早停机制，避免不必要的扩展
 4. 更清晰的日志输出
 """
 import asyncio
 from typing import TYPE_CHECKING
 from src.common.logger import get_logger
@@ -28,10 +34,16 @@ async def expand_memories_with_semantic_filter(
    max_expanded: int = 20,
 ) -> list[tuple[str, float]]:
    """
-    从初始记忆集合出发，沿图结构扩展，并用语义相似度过滤
+    从初始记忆集合出发，沿图结构扩展，并用语义相似度过滤（优化版）
    这个方法解决了纯向量搜索可能遗漏的"语义相关且图结构相关"的记忆。
    优化改进：
    - 使用记忆级别的BFS，而非节点级别（更直接）
    - 批量获取邻居记忆，减少遍历次数
    - 早停机制：达到max_expanded后立即停止
    - 更详细的调试日志
    Args:
        graph_store: 图存储
        vector_store: 向量存储
@@ -48,102 +60,136 @@ async def expand_memories_with_semantic_filter(
        return []
    try:
        import time
        start_time = time.time()
        # 记录已访问的记忆，避免重复
        visited_memories = set(initial_memory_ids)
        # 记录扩展的记忆及其分数
        expanded_memories: dict[str, float] = {}
-        # BFS扩展
+        # BFS扩展（基于记忆而非节点）
-        current_level = initial_memory_ids
+        current_level_memories = initial_memory_ids
        depth_stats = []  # 每层统计
        for depth in range(max_depth):
-            next_level = []
+            next_level_memories = []
            candidates_checked = 0
            candidates_passed = 0
-            for memory_id in current_level:
+            logger.debug(f"🔍 图扩展 - 深度 {depth+1}/{max_depth}, 当前层记忆数: {len(current_level_memories)}")
            # 遍历当前层的记忆
            for memory_id in current_level_memories:
                memory = graph_store.get_memory_by_id(memory_id)
                if not memory:
                    continue
-                # 遍历该记忆的所有节点
+                # 获取该记忆的邻居记忆（通过边关系）
-                for node in memory.nodes:
+                neighbor_memory_ids = set()
-                    if not node.has_embedding():
+                
                # 遍历记忆的所有边，收集邻居记忆
                for edge in memory.edges:
                    # 获取边的目标节点
                    target_node_id = edge.target_id
                    source_node_id = edge.source_id
                    # 通过节点找到其他记忆
                    for node_id in [target_node_id, source_node_id]:
                        if node_id in graph_store.node_to_memories:
                            neighbor_memory_ids.update(graph_store.node_to_memories[node_id])
                # 过滤掉已访问的和自己
                neighbor_memory_ids.discard(memory_id)
                neighbor_memory_ids -= visited_memories
                # 批量评估邻居记忆
                for neighbor_mem_id in neighbor_memory_ids:
                    candidates_checked += 1
                    neighbor_memory = graph_store.get_memory_by_id(neighbor_mem_id)
                    if not neighbor_memory:
                        continue
-                    # 获取邻居节点
+                    # 获取邻居记忆的主题节点向量
-                    try:
+                    topic_node = next(
-                        neighbors = list(graph_store.graph.neighbors(node.id))
+                        (n for n in neighbor_memory.nodes if n.has_embedding()),
-                    except Exception:
+                        None
                    )
                    if not topic_node or topic_node.embedding is None:
                        continue
-                    for neighbor_id in neighbors:
+                    # 计算语义相似度
-                        # 获取邻居节点信息
+                    semantic_sim = cosine_similarity(query_embedding, topic_node.embedding)
                        neighbor_node_data = graph_store.graph.nodes.get(neighbor_id)
                        if not neighbor_node_data:
                            continue
-                        # 获取邻居节点的向量（从向量存储）
+                    # 计算边的重要性（影响评分）
-                        neighbor_vector_data = await vector_store.get_node_by_id(neighbor_id)
+                    edge_importance = neighbor_memory.importance * 0.5  # 使用记忆重要性作为边权重
                        if not neighbor_vector_data or neighbor_vector_data.get("embedding") is None:
                            continue
-                        neighbor_embedding = neighbor_vector_data["embedding"]
+                    # 综合评分：语义相似度(70%) + 重要性(20%) + 深度衰减(10%)
-
+                    depth_decay = 1.0 / (depth + 2)  # 深度衰减
                        # 计算与查询的语义相似度
                        semantic_sim = cosine_similarity(query_embedding, neighbor_embedding)
                        # 获取边的权重
                        try:
                            edge_data = graph_store.graph.get_edge_data(node.id, neighbor_id)
                            edge_importance = edge_data.get("importance", 0.5) if edge_data else 0.5
                        except Exception:
                            edge_importance = 0.5
                        # 综合评分：语义相似度(70%) + 图结构权重(20%) + 深度衰减(10%)
                        depth_decay = 1.0 / (depth + 1)  # 深度越深，权重越低
                    relevance_score = semantic_sim * 0.7 + edge_importance * 0.2 + depth_decay * 0.1
-                        # 只保留超过阈值的节点
+                    # 只保留超过阈值的
                    if relevance_score < semantic_threshold:
                        continue
-                        # 提取邻居节点所属的记忆
+                    candidates_passed += 1
                        neighbor_memory_ids = neighbor_node_data.get("memory_ids", [])
                        if isinstance(neighbor_memory_ids, str):
                            import json
-                            try:
+                    # 记录扩展的记忆
                                neighbor_memory_ids = json.loads(neighbor_memory_ids)
                            except Exception:
                                neighbor_memory_ids = [neighbor_memory_ids]
                        for neighbor_mem_id in neighbor_memory_ids:
                            if neighbor_mem_id in visited_memories:
                                continue
                            # 记录这个扩展记忆
                    if neighbor_mem_id not in expanded_memories:
                        expanded_memories[neighbor_mem_id] = relevance_score
                        visited_memories.add(neighbor_mem_id)
-                                next_level.append(neighbor_mem_id)
+                        next_level_memories.append(neighbor_mem_id)
                    else:
                        # 如果已存在，取最高分
                        expanded_memories[neighbor_mem_id] = max(
                            expanded_memories[neighbor_mem_id], relevance_score
                        )
-            # 如果没有新节点或已达到数量限制，提前终止
+                    # 早停：达到最大扩展数量
-            if not next_level or len(expanded_memories) >= max_expanded:
+                    if len(expanded_memories) >= max_expanded:
                        logger.debug(f"⏹️  提前停止：已达到最大扩展数量 {max_expanded}")
                        break
-            current_level = next_level[:max_expanded]  # 限制每层的扩展数量
+                # 早停检查
                if len(expanded_memories) >= max_expanded:
                    break
            # 记录本层统计
            depth_stats.append({
                "depth": depth + 1,
                "checked": candidates_checked,
                "passed": candidates_passed,
                "expanded_total": len(expanded_memories)
            })
            # 如果没有新记忆或已达到数量限制，提前终止
            if not next_level_memories or len(expanded_memories) >= max_expanded:
                logger.debug(f"⏹️  停止扩展：{'无新记忆' if not next_level_memories else '达到上限'}")
                break
            # 限制下一层的记忆数量，避免爆炸性增长
            current_level_memories = next_level_memories[:max_expanded]
            # 每层让出控制权
            await asyncio.sleep(0.001)
        # 排序并返回
        sorted_results = sorted(expanded_memories.items(), key=lambda x: x[1], reverse=True)[:max_expanded]
        elapsed = time.time() - start_time
        logger.info(
-            f"图扩展完成: 初始{len(initial_memory_ids)}个 → "
+            f"✅ 图扩展完成: 初始{len(initial_memory_ids)}个 → "
            f"扩展{len(sorted_results)}个新记忆 "
-            f"(深度={max_depth}, 阈值={semantic_threshold:.2f})"
+            f"(深度={max_depth}, 阈值={semantic_threshold:.2f}, 耗时={elapsed:.3f}s)"
        )
        # 输出每层统计
        for stat in depth_stats:
            logger.debug(
                f"  深度{stat['depth']}: 检查{stat['checked']}个, "
                f"通过{stat['passed']}个, 累计扩展{stat['expanded_total']}个"
            )
        return sorted_results