🤖 自动格式化代码 [skip ci]
This commit is contained in:
@@ -25,6 +25,7 @@ OPENIE_DIR = global_config["persistence"]["openie_data_path"] or os.path.join(RO
|
|||||||
|
|
||||||
logger = get_logger("OpenIE导入")
|
logger = get_logger("OpenIE导入")
|
||||||
|
|
||||||
|
|
||||||
def ensure_openie_dir():
|
def ensure_openie_dir():
|
||||||
"""确保OpenIE数据目录存在"""
|
"""确保OpenIE数据目录存在"""
|
||||||
if not os.path.exists(OPENIE_DIR):
|
if not os.path.exists(OPENIE_DIR):
|
||||||
@@ -33,6 +34,7 @@ def ensure_openie_dir():
|
|||||||
else:
|
else:
|
||||||
logger.info(f"OpenIE数据目录已存在:{OPENIE_DIR}")
|
logger.info(f"OpenIE数据目录已存在:{OPENIE_DIR}")
|
||||||
|
|
||||||
|
|
||||||
def hash_deduplicate(
|
def hash_deduplicate(
|
||||||
raw_paragraphs: dict[str, str],
|
raw_paragraphs: dict[str, str],
|
||||||
triple_list_data: dict[str, list[list[str]]],
|
triple_list_data: dict[str, list[list[str]]],
|
||||||
|
|||||||
@@ -45,6 +45,7 @@ open_ie_doc_lock = Lock()
|
|||||||
# 创建一个事件标志,用于控制程序终止
|
# 创建一个事件标志,用于控制程序终止
|
||||||
shutdown_event = Event()
|
shutdown_event = Event()
|
||||||
|
|
||||||
|
|
||||||
def ensure_dirs():
|
def ensure_dirs():
|
||||||
"""确保临时目录和输出目录存在"""
|
"""确保临时目录和输出目录存在"""
|
||||||
if not os.path.exists(TEMP_DIR):
|
if not os.path.exists(TEMP_DIR):
|
||||||
@@ -57,6 +58,7 @@ def ensure_dirs():
|
|||||||
os.makedirs(IMPORTED_DATA_PATH)
|
os.makedirs(IMPORTED_DATA_PATH)
|
||||||
logger.info(f"已创建导入数据目录: {IMPORTED_DATA_PATH}")
|
logger.info(f"已创建导入数据目录: {IMPORTED_DATA_PATH}")
|
||||||
|
|
||||||
|
|
||||||
def process_single_text(pg_hash, raw_data, llm_client_list):
|
def process_single_text(pg_hash, raw_data, llm_client_list):
|
||||||
"""处理单个文本的函数,用于线程池"""
|
"""处理单个文本的函数,用于线程池"""
|
||||||
temp_file_path = f"{TEMP_DIR}/{pg_hash}.json"
|
temp_file_path = f"{TEMP_DIR}/{pg_hash}.json"
|
||||||
|
|||||||
Reference in New Issue
Block a user