Files
Mofox-Core/docs/0.6Bing.md
2025-05-16 17:52:33 +08:00

5.6 KiB
Raw Blame History

  • 智能化 MaiState 状态转换:

    • 当前 MaiState (整体状态,如 OFFLINE, NORMAL_CHAT 等) 的转换逻辑 (MaiStateManager) 较为简单,主要依赖时间和随机性。
    • 未来的计划是让主心流 (Heartflow) 负责决策自身的 MaiState
    • 该决策将综合考虑以下信息:
      • 各个子心流 (SubHeartflow) 的活动状态和信息摘要。
      • 主心流自身的状态和历史信息。
      • (可能) 结合预设的日程安排 (Schedule) 信息。
    • 目标是让 Mai 的整体状态变化更符合逻辑和上下文。 (计划在 064 实现)
  • 参数化与动态调整聊天行为:

    • NormalChatInstanceHeartFlowChatInstance 中的关键行为参数(例如:回复概率、思考频率、兴趣度阈值、状态转换条件等)提取出来,使其更易于配置。
    • 允许每个 SubHeartflow (即每个聊天场景) 拥有其独立的参数配置,实现"千群千面"。
    • 开发机制,使得这些参数能够被动态调整:
      • 基于外部反馈:例如,根据用户评价("话太多"或"太冷淡")调整回复频率。
      • 基于环境分析:例如,根据群消息的活跃度自动调整参与度。
      • 基于学习:通过分析历史交互数据,优化特定群聊下的行为模式。
    • 目标是让 Mai 在不同群聊中展现出更适应环境、更个性化的交互风格。
  • 动态 Prompt 生成与人格塑造:

    • 当前 Prompt (提示词) 相对静态。计划实现动态或半结构化的 Prompt 生成。
    • Prompt 内容可根据以下因素调整:
      • 人格特质: 通过参数化配置(如友善度、严谨性等),影响 Prompt 的措辞、语气和思考倾向,塑造更稳定和独特的人格。
      • 当前情绪: 将实时情绪状态融入 Prompt使回复更符合当下心境。
    • 目标:提升 HeartFlowChatInstance (HFC) 回复的多样性、一致性和真实感。
    • 前置:需要重构 Prompt 构建逻辑,可能引入 PromptBuilder 并提供标准接口 (认为是必须步骤)。
  • 增强工具调用能力 (Enhanced Tool Usage):

    • 扩展 HeartFlowChatInstance (HFC) 可用的工具集。
    • 考虑引入"元工具"或分层工具机制,允许 HFC 在需要时(如深度思考)访问更强大的工具,例如:
      • 修改自身或其他 SubHeartflow 的聊天参数。
      • 请求改变 Mai 的全局状态 (MaiState)。
      • 管理日程或执行更复杂的分析任务。
    • 目标:提升 HFC 的自主决策和行动能力,即使会增加一定的延迟。
  • 基于历史学习的行为模式应用:

    • 学习: 分析过往聊天记录,提取和学习具体的行为模式(如特定梗的用法、情境化回应风格等)。可能需要专门的分析模块。
    • 存储与匹配: 需要有效的方法存储学习到的行为模式,并开发强大的 匹配 机制,在运行时根据当前情境检索最合适的模式。(匹配的准确性是关键)
    • 应用与评估: 将匹配到的行为模式融入 HFC 的决策和回复生成(例如,将其整合进 Prompt。之后需评估该行为模式应用的实际效果。
    • 人格塑造: 通过学习到的实际行为来动态塑造人格,作为静态人设描述的补充或替代,使其更生动自然。
  • 标准化人设生成 (Standardized Persona Generation):

    • 目标: 解决手动配置 人设 文件缺乏标准、难以全面描述个性的问题,并生成更丰富、可操作的人格资源。
    • 方法: 利用大型语言模型 (LLM) 辅助生成标准化的、结构化的人格资源包
    • 生成内容: 不仅生成描述性文本(替代现有 individual 配置),还可以同时生成与该人格配套的:
      • 相关工具 (Tools): 该人格倾向于使用的工具或能力。
      • 初始记忆/知识库 (Memories/Knowledge): 定义其背景和知识基础。
      • 核心行为模式 (Core Behavior Patterns): 预置一些典型的行为方式,可作为行为学习的起点。
    • 实现途径:
      • 通过与 LLM 的交互式对话来定义和细化人格及其配套资源。
      • 让 LLM 分析提供的文本材料(如小说、背景故事)来提取人格特质和相关信息。
    • 优势: 替代易出错且标准不一的手动配置,生成更丰富、一致、包含配套资源且易于系统理解和应用的人格包。
  • 探索高级记忆检索机制 (GE 系统概念):

    • 研究超越简单关键词/近期性检索的记忆模型。
    • 考虑引入基于事件关联、相对时间线索和绝对时间锚点的检索方式。
    • 可能涉及设计新的事件表示或记忆结构。
  • 实现 SubHeartflow 级记忆缓存池:

    • SubHeartflow 层级或更高层级设计并实现一个缓存池,存储已检索的记忆/信息。
    • 避免在 HFC 等循环中重复进行相同的记忆检索调用。
    • 确保存储的信息能有效服务于当前交互上下文。
  • 基于人格生成预设知识:

    • 开发利用 LLM 和人格配置生成背景知识的功能。
    • 这些知识应符合角色的行为风格和可能的经历。
    • 作为一种"冷启动"或丰富角色深度的方式。

开发计划TODOLIST

  • 人格功能WIP
  • 对特定对象的侧写功能
  • 图片发送转发功能WIP
  • 幽默和meme功能WIP
  • 小程序转发链接解析
  • 自动生成的回复逻辑,例如自生成的回复方向,回复风格