diff --git a/README.md b/README.md
index bd5f1cc94..3381a3cfe 100644
--- a/README.md
+++ b/README.md
@@ -24,10 +24,6 @@
   <br />
   <a href="https://qm.qq.com/q/YwZTZl7BG8">
     <img src="https://img.shields.io/badge/墨狐狐的大学-169850076-violet?style=flat-square" alt="QQ Group">
-  </a>
-  <a href="https://qm.qq.com/q/Lmm1LZnewg">
-    <img src="https://img.shields.io/badge/墨狐狐技术部-1064097634-orange?style=flat-square" alt="QQ Group">
-  </a>
 </p>
 
 ---
diff --git a/src/common/database/optimization/cache_manager.py b/src/common/database/optimization/cache_manager.py
index 27b7b33a2..b7f62a631 100644
--- a/src/common/database/optimization/cache_manager.py
+++ b/src/common/database/optimization/cache_manager.py
@@ -17,7 +17,7 @@ from dataclasses import dataclass
 from typing import Any, Generic, TypeVar
 
 from src.common.logger import get_logger
-from src.common.memory_utils import estimate_size_smart
+from src.common.memory_utils import estimate_cache_item_size
 
 logger = get_logger("cache_manager")
 
@@ -237,7 +237,7 @@ class LRUCache(Generic[T]):
         使用深度递归估算，比 sys.getsizeof() 更准确
         """
         try:
-            return estimate_size_smart(value)
+            return estimate_cache_item_size(value)
         except (TypeError, AttributeError):
             # 无法获取大小，返回默认值
             return 1024
@@ -345,7 +345,7 @@ class MultiLevelCache:
         """
         # 估算数据大小（如果未提供）
         if size is None:
-            size = estimate_size_smart(value)
+            size = estimate_cache_item_size(value)
 
         # 检查单个条目大小是否超过限制
         if size > self.max_item_size_bytes:
diff --git a/src/common/memory_utils.py b/src/common/memory_utils.py
index 17971181e..c75a219ef 100644
--- a/src/common/memory_utils.py
+++ b/src/common/memory_utils.py
@@ -169,6 +169,30 @@ def _estimate_recursive(obj: Any, depth: int, seen: set, sample_large: bool) ->
     return size
 
 
+def estimate_cache_item_size(obj: Any) -> int:
+    """
+    估算缓存条目的大小。
+
+    结合深度递归和 pickle 大小，选择更保守的估值，
+    以避免大量嵌套对象被低估。
+    """
+    try:
+        smart_size = estimate_size_smart(obj, max_depth=10, sample_large=False)
+    except Exception:
+        smart_size = 0
+
+    try:
+        deep_size = get_accurate_size(obj)
+    except Exception:
+        deep_size = 0
+
+    pickle_size = get_pickle_size(obj)
+
+    best = max(smart_size, deep_size, pickle_size)
+    # 至少返回基础大小，避免 0
+    return best or sys.getsizeof(obj)
+
+
 def format_size(size_bytes: int) -> str:
     """
     格式化字节数为人类可读的格式
diff --git a/src/memory_graph/core/builder.py b/src/memory_graph/core/builder.py
index 00f55c0fa..4846d7892 100644
--- a/src/memory_graph/core/builder.py
+++ b/src/memory_graph/core/builder.py
@@ -379,6 +379,7 @@ class MemoryBuilder:
                     node_type=NodeType(node_data["node_type"]),
                     embedding=None,  # 图存储不包含 embedding，需要从向量数据库获取
                     metadata=node_data.get("metadata", {}),
+                    has_vector=node_data.get("has_vector", False),
                 )
 
         return None
@@ -424,6 +425,7 @@ class MemoryBuilder:
                         node_type=NodeType(node_data["node_type"]),
                         embedding=None,  # 图存储不包含 embedding，需要从向量数据库获取
                         metadata=node_data.get("metadata", {}),
+                        has_vector=node_data.get("has_vector", False),
                     )
                     # 添加当前记忆ID到元数据
                     return existing_node
@@ -474,6 +476,7 @@ class MemoryBuilder:
                         node_type=NodeType(node_data["node_type"]),
                         embedding=None,  # 图存储不包含 embedding，需要从向量数据库获取
                         metadata=node_data.get("metadata", {}),
+                        has_vector=node_data.get("has_vector", False),
                     )
                     return existing_node
 
diff --git a/src/memory_graph/long_term_manager.py b/src/memory_graph/long_term_manager.py
index 8dba0fc2d..245fdbe2d 100644
--- a/src/memory_graph/long_term_manager.py
+++ b/src/memory_graph/long_term_manager.py
@@ -922,6 +922,9 @@ class LongTermMemoryManager:
                     embedding=embedding
                 )
                 await self.memory_manager.vector_store.add_node(node)
+                node.mark_vector_stored()
+                if self.memory_manager.graph_store.graph.has_node(node_id):
+                    self.memory_manager.graph_store.graph.nodes[node_id]["has_vector"] = True
         except Exception as e:
             logger.warning(f"生成节点 embedding 失败: {e}")
 
diff --git a/src/memory_graph/manager.py b/src/memory_graph/manager.py
index 8ddd8a0b4..9cf68e7f0 100644
--- a/src/memory_graph/manager.py
+++ b/src/memory_graph/manager.py
@@ -359,9 +359,13 @@ class MemoryManager:
                 return False
 
             # 从向量存储删除节点
-            for node in memory.nodes:
-                if node.embedding is not None:
-                    await self.vector_store.delete_node(node.id)
+            if self.vector_store:
+                for node in memory.nodes:
+                    if getattr(node, "has_vector", False):
+                        await self.vector_store.delete_node(node.id)
+                        node.has_vector = False
+                        if self.graph_store.graph.has_node(node.id):
+                            self.graph_store.graph.nodes[node.id]["has_vector"] = False
 
             # 从图存储删除记忆
             self.graph_store.remove_memory(memory_id)
@@ -900,13 +904,17 @@ class MemoryManager:
 
             # 1. 从向量存储删除节点的嵌入向量
             deleted_vectors = 0
-            for node in memory.nodes:
-                if node.embedding is not None:
-                    try:
-                        await self.vector_store.delete_node(node.id)
-                        deleted_vectors += 1
-                    except Exception as e:
-                        logger.warning(f"删除节点向量失败 {node.id}: {e}")
+            if self.vector_store:
+                for node in memory.nodes:
+                    if getattr(node, "has_vector", False):
+                        try:
+                            await self.vector_store.delete_node(node.id)
+                            deleted_vectors += 1
+                            node.has_vector = False
+                            if self.graph_store.graph.has_node(node.id):
+                                self.graph_store.graph.nodes[node.id]["has_vector"] = False
+                        except Exception as e:
+                            logger.warning(f"删除节点向量失败 {node.id}: {e}")
 
             # 2. 从图存储删除记忆
             success = self.graph_store.remove_memory(memory_id, cleanup_orphans=False)
diff --git a/src/memory_graph/models.py b/src/memory_graph/models.py
index 34773e15c..3f4378e9c 100644
--- a/src/memory_graph/models.py
+++ b/src/memory_graph/models.py
@@ -121,6 +121,7 @@ class MemoryNode:
     node_type: NodeType  # 节点类型
     embedding: np.ndarray | None = None  # 语义向量（仅主题/客体需要）
     metadata: dict[str, Any] = field(default_factory=dict)  # 扩展元数据
+    has_vector: bool = False  # 是否已写入向量存储
     created_at: datetime = field(default_factory=datetime.now)
 
     def __post_init__(self):
@@ -137,6 +138,7 @@ class MemoryNode:
             "node_type": self.node_type.value,
             "metadata": self.metadata,
             "created_at": self.created_at.isoformat(),
+            "has_vector": self.has_vector,
         }
 
     @classmethod
@@ -150,12 +152,18 @@ class MemoryNode:
             embedding=None,  # 向量数据需要从向量数据库中单独加载
             metadata=data.get("metadata", {}),
             created_at=datetime.fromisoformat(data["created_at"]),
+            has_vector=data.get("has_vector", False),
         )
 
     def has_embedding(self) -> bool:
-        """是否有语义向量"""
+        """是否持有可用的语义向量数据"""
         return self.embedding is not None
 
+    def mark_vector_stored(self) -> None:
+        """标记该节点已写入向量存储，并清理内存中的 embedding 数据。"""
+        self.has_vector = True
+        self.embedding = None
+
     def __str__(self) -> str:
         return f"Node({self.node_type.value}: {self.content})"
 
diff --git a/src/memory_graph/perceptual_manager.py b/src/memory_graph/perceptual_manager.py
index e69e69afa..6a41a09d2 100644
--- a/src/memory_graph/perceptual_manager.py
+++ b/src/memory_graph/perceptual_manager.py
@@ -10,6 +10,7 @@
 """
 
 import asyncio
+import time
 import uuid
 from datetime import datetime
 from pathlib import Path
@@ -40,6 +41,9 @@ class PerceptualMemoryManager:
         activation_threshold: int = 3,
         recall_top_k: int = 5,
         recall_similarity_threshold: float = 0.55,
+        pending_message_ttl: int = 600,
+        max_pending_per_stream: int = 50,
+        max_pending_messages: int = 2000,
     ):
         """
         初始化感知记忆层管理器
@@ -51,6 +55,9 @@ class PerceptualMemoryManager:
             activation_threshold: 激活阈值（召回次数）
             recall_top_k: 召回时返回的最大块数
             recall_similarity_threshold: 召回的相似度阈值
+            pending_message_ttl: 待组块消息最大保留时间（秒）
+            max_pending_per_stream: 单个流允许的待组块消息上限
+            max_pending_messages: 全部流的待组块消息总上限
         """
         self.data_dir = data_dir or Path("data/memory_graph")
         self.data_dir.mkdir(parents=True, exist_ok=True)
@@ -61,6 +68,9 @@ class PerceptualMemoryManager:
         self.activation_threshold = activation_threshold
         self.recall_top_k = recall_top_k
         self.recall_similarity_threshold = recall_similarity_threshold
+        self.pending_message_ttl = max(0, pending_message_ttl)
+        self.max_pending_per_stream = max(0, max_pending_per_stream)
+        self.max_pending_messages = max(0, max_pending_messages)
 
         # 核心数据
         self.perceptual_memory: PerceptualMemory | None = None
@@ -104,6 +114,8 @@ class PerceptualMemoryManager:
                     max_blocks=self.max_blocks,
                     block_size=self.block_size,
                 )
+            else:
+                self._cleanup_pending_messages()
 
             self._initialized = True
             logger.info(
@@ -138,18 +150,28 @@ class PerceptualMemoryManager:
             await self.initialize()
 
         try:
-            # 添加到待处理消息队列
-            self.perceptual_memory.pending_messages.append(message)
-            
+            if not hasattr(self.perceptual_memory, "pending_messages"):
+                self.perceptual_memory.pending_messages = []
+
+            self._cleanup_pending_messages()
+
             stream_id = message.get("stream_id", "unknown")
+            self._normalize_message_timestamp(message)
+            self.perceptual_memory.pending_messages.append(message)
+            self._enforce_pending_limits(stream_id)
+
             logger.debug(
                 f"消息已添加到待处理队列 (stream={stream_id[:8]}, "
                 f"总数={len(self.perceptual_memory.pending_messages)})"
             )
 
             # 按 stream_id 检查是否达到创建块的条件
-            stream_messages = [msg for msg in self.perceptual_memory.pending_messages if msg.get("stream_id") == stream_id]
-            
+            stream_messages = [
+                msg
+                for msg in self.perceptual_memory.pending_messages
+                if msg.get("stream_id") == stream_id
+            ]
+
             if len(stream_messages) >= self.block_size:
                 new_block = await self._create_memory_block(stream_id)
                 return new_block
@@ -171,6 +193,7 @@ class PerceptualMemoryManager:
             新创建的记忆块，失败返回 None
         """
         try:
+            self._cleanup_pending_messages()
             # 只取出指定 stream_id 的 block_size 条消息
             stream_messages = [msg for msg in self.perceptual_memory.pending_messages if msg.get("stream_id") == stream_id]
             
@@ -227,6 +250,82 @@ class PerceptualMemoryManager:
             logger.error(f"创建记忆块失败: {e}", exc_info=True)
             return None
 
+    def _normalize_message_timestamp(self, message: dict[str, Any]) -> float:
+        """确保消息包含 timestamp 字段并返回其值。"""
+        raw_ts = message.get("timestamp", message.get("time"))
+        try:
+            timestamp = float(raw_ts)
+        except (TypeError, ValueError):
+            timestamp = time.time()
+        message["timestamp"] = timestamp
+        return timestamp
+
+    def _cleanup_pending_messages(self) -> None:
+        """移除过期/超限的待组块消息，避免内存无限增长。"""
+        if not self.perceptual_memory or not getattr(self.perceptual_memory, "pending_messages", None):
+            return
+
+        pending = self.perceptual_memory.pending_messages
+        now = time.time()
+        removed = 0
+
+        if self.pending_message_ttl > 0:
+            filtered: list[dict[str, Any]] = []
+            ttl = float(self.pending_message_ttl)
+            for msg in pending:
+                ts = msg.get("timestamp") or msg.get("time")
+                try:
+                    ts_value = float(ts)
+                except (TypeError, ValueError):
+                    ts_value = time.time()
+                msg["timestamp"] = ts_value
+                if now - ts_value <= ttl:
+                    filtered.append(msg)
+                else:
+                    removed += 1
+
+            if removed:
+                pending[:] = filtered
+
+        # 全局上限，按 FIFO 丢弃最旧的消息
+        if self.max_pending_messages > 0 and len(pending) > self.max_pending_messages:
+            overflow = len(pending) - self.max_pending_messages
+            del pending[:overflow]
+            removed += overflow
+
+        if removed:
+            logger.debug(f"清理待组块消息 {removed} 条 (剩余 {len(pending)})")
+
+    def _enforce_pending_limits(self, stream_id: str) -> None:
+        """保证单个 stream 的待组块消息不超过限制。"""
+        if (
+            not self.perceptual_memory
+            or not getattr(self.perceptual_memory, "pending_messages", None)
+            or self.max_pending_per_stream <= 0
+        ):
+            return
+
+        pending = self.perceptual_memory.pending_messages
+        indexes = [
+            idx
+            for idx, msg in enumerate(pending)
+            if msg.get("stream_id") == stream_id
+        ]
+
+        overflow = len(indexes) - self.max_pending_per_stream
+        if overflow <= 0:
+            return
+
+        for idx in reversed(indexes[:overflow]):
+            pending.pop(idx)
+
+        logger.warning(
+            "stream %s 待组块消息过多，丢弃 %d 条旧消息 (保留 %d 条)",
+            stream_id,
+            overflow,
+            self.max_pending_per_stream,
+        )
+
     def _combine_messages(self, messages: list[dict[str, Any]]) -> str:
         """
         合并多条消息为单一文本
@@ -508,6 +607,8 @@ class PerceptualMemoryManager:
                 if not self.perceptual_memory:
                     return
 
+                self._cleanup_pending_messages()
+
                 # 保存到 JSON 文件
                 import orjson
 
diff --git a/src/memory_graph/storage/graph_store.py b/src/memory_graph/storage/graph_store.py
index 6e13f6acd..516714f49 100644
--- a/src/memory_graph/storage/graph_store.py
+++ b/src/memory_graph/storage/graph_store.py
@@ -53,6 +53,7 @@ class GraphStore:
                         node_type=node.node_type.value,
                         created_at=node.created_at.isoformat(),
                         metadata=node.metadata,
+                        has_vector=node.has_vector,
                     )
 
                 # 更新节点到记忆的映射
@@ -120,6 +121,7 @@ class GraphStore:
                     node_type=node_type,
                     created_at=datetime.now().isoformat(),
                     metadata=metadata or {},
+                    has_vector=(metadata or {}).get("has_vector", False),
                 )
             else:
                 # 如果节点已存在，更新内容（可选）
@@ -144,7 +146,8 @@ class GraphStore:
                     id=node_id,
                     content=content,
                     node_type=node_type_enum,
-                    metadata=metadata or {}
+                    metadata=metadata or {},
+                    has_vector=(metadata or {}).get("has_vector", False)
                 )
                 memory.nodes.append(new_node)
 
diff --git a/src/memory_graph/tools/memory_tools.py b/src/memory_graph/tools/memory_tools.py
index 0512c0328..a970b2448 100644
--- a/src/memory_graph/tools/memory_tools.py
+++ b/src/memory_graph/tools/memory_tools.py
@@ -1211,6 +1211,9 @@ class MemoryTools:
         for node in memory.nodes:
             if node.embedding is not None:
                 await self.vector_store.add_node(node)
+                node.mark_vector_stored()
+                if self.graph_store.graph.has_node(node.id):
+                    self.graph_store.graph.nodes[node.id]["has_vector"] = True
 
     async def _find_memory_by_description(self, description: str) -> Memory | None:
         """