better: 更好的表情包发送系统

2025-04-14 23:04:22 +08:00
parent 200755dc8c
commit 96ae2b4a1b
11 changed files with 98 additions and 1294 deletions
--- a/src/plugins/chat/utils.py
+++ b/src/plugins/chat/utils.py
@@ -324,27 +324,35 @@ def random_remove_punctuation(text: str) -> str:


 def process_llm_response(text: str) -> List[str]:
-    # processed_response = process_text_with_typos(content)
-    # 对西文字符段落的回复长度设置为汉字字符的两倍
-    max_length = global_config.response_max_length * 3
+    # 提取被 () 或 [] 包裹的内容
+    pattern = re.compile(r'[\(\[].*?[\)\]]')
+    _extracted_contents = pattern.findall(text)
+    # 去除 () 和 [] 及其包裹的内容
+    cleaned_text = pattern.sub('', text)
+    logger.debug(f"{text}去除括号处理后的文本: {cleaned_text}")
+    
+    # 对清理后的文本进行进一步处理
+    max_length = global_config.response_max_length * 2
    max_sentence_num = global_config.response_max_sentence_num
-    if len(text) > max_length and not is_western_paragraph(text):
-        logger.warning(f"回复过长 ({len(text)} 字符)，返回默认回复")
+    if len(cleaned_text) > max_length and not is_western_paragraph(cleaned_text):
+        logger.warning(f"回复过长 ({len(cleaned_text)} 字符)，返回默认回复")
        return ["懒得说"]
-    elif len(text) > 200:
-        logger.warning(f"回复过长 ({len(text)} 字符)，返回默认回复")
+    elif len(cleaned_text) > 200:
+        logger.warning(f"回复过长 ({len(cleaned_text)} 字符)，返回默认回复")
        return ["懒得说"]
-    # 处理长消息
+
    typo_generator = ChineseTypoGenerator(
        error_rate=global_config.chinese_typo_error_rate,
        min_freq=global_config.chinese_typo_min_freq,
        tone_error_rate=global_config.chinese_typo_tone_error_rate,
        word_replace_rate=global_config.chinese_typo_word_replace_rate,
    )
+
    if global_config.enable_response_splitter:
-        split_sentences = split_into_sentences_w_remove_punctuation(text)
+        split_sentences = split_into_sentences_w_remove_punctuation(cleaned_text)
    else:
-        split_sentences = [text]
+        split_sentences = [cleaned_text]
+
    sentences = []
    for sentence in split_sentences:
        if global_config.chinese_typo_enable:
@@ -354,11 +362,12 @@ def process_llm_response(text: str) -> List[str]:
                sentences.append(typo_corrections)
        else:
            sentences.append(sentence)
-    # 检查分割后的消息数量是否过多（超过3条）

    if len(sentences) > max_sentence_num:
        logger.warning(f"分割后消息数量过多 ({len(sentences)} 条)，返回默认回复")
        return [f"{global_config.BOT_NICKNAME}不知道哦"]
+    
+    # sentences.extend(extracted_contents)

    return sentences