# 表情替换候选数量说明

## 背景
`MAX_EMOJI_FOR_PROMPT` 用于 `replace_a_emoji` 等场景，限制送入 LLM 的候选表情数量，避免上下文过长导致响应变慢或 token 开销过大。

## 为什么是 20
- 平衡：超过十几项后决策收益递减，但 token/时间成本线性增加。
- 性能：在常用模型和硬件下，20 个描述可在可接受延迟内返回决策。
- 兼容：历史实现也使用 20，保持行为稳定。

## 何时调整
- 设备/模型更强且希望更广覆盖：可提升到 30-40，但注意延迟和费用。
- 低算力或对延迟敏感：可下调到 10-15 以加快决策。
- 特殊场景（主题集中、库很小）：下调有助于避免无意义的冗余候选。

## 如何修改
- 常量位置：`src/chat/emoji_system/emoji_constants.py` 中的 `MAX_EMOJI_FOR_PROMPT`。
- 如需动态配置，可将其迁移到 `global_config.emoji` 下的配置项并在 `emoji_manager` 读取。

## 建议
- 调整后观察：替换决策耗时、模型费用、误删率（删除的表情是否被实际需要）。
- 如继续扩展表情库规模，建议为候选列表增加基于使用频次或时间的预筛选策略。