llm统计记录模型反应时间

2025-08-16 14:26:18 +08:00
parent 8277e19728
commit 7dfaf54c9c
4 changed files with 89 additions and 8 deletions
--- a/src/llm_models/utils.py
+++ b/src/llm_models/utils.py
@@ -147,7 +147,7 @@ class LLMUsageRecorder:


    def record_usage_to_database(
-        self, model_info: ModelInfo, model_usage: UsageRecord, user_id: str, request_type: str, endpoint: str
+        self, model_info: ModelInfo, model_usage: UsageRecord, user_id: str, request_type: str, endpoint: str, time_cost: float = 0.0
    ):
        input_cost = (model_usage.prompt_tokens / 1000000) * model_info.price_in
        output_cost = (model_usage.completion_tokens / 1000000) * model_info.price_out
@@ -160,6 +160,8 @@ class LLMUsageRecorder:
            
            usage_record = LLMUsage(
                model_name=model_info.model_identifier,
+                model_assign_name=model_info.name,
+                model_api_provider=model_info.api_provider,
                user_id=user_id,
                request_type=request_type,
                endpoint=endpoint,
@@ -167,6 +169,7 @@ class LLMUsageRecorder:
                completion_tokens=model_usage.completion_tokens or 0,
                total_tokens=model_usage.total_tokens or 0,
                cost=total_cost or 0.0,
+                time_cost = round(time_cost or 0.0, 3),
                status="success",
                timestamp=datetime.now(),  # SQLAlchemy 会处理 DateTime 字段
            )
--- a/src/llm_models/utils_model.py
+++ b/src/llm_models/utils_model.py
@@ -115,6 +115,7 @@ class LLMRequest:
        normalized_format = _normalize_image_format(image_format)
        
        # 模型选择
+        start_time = time.time()
        model_info, api_provider, client = self._select_model()

        # 请求体构建
@@ -147,6 +148,7 @@ class LLMRequest:
                model_info=model_info,
                model_usage=usage,
                user_id="system",
+                time_cost=time.time() - start_time,
                request_type=self.request_type,
                endpoint="/chat/completions",
            )
@@ -240,6 +242,7 @@ class LLMRequest:
    ) -> Tuple[str, Tuple[str, str, Optional[List[ToolCall]]]]:
        """执行单次请求"""
        # 模型选择和请求准备
+        start_time = time.time()
        model_info, api_provider, client = self._select_model()
        processed_prompt = self._apply_content_obfuscation(prompt, api_provider)
        
@@ -293,6 +296,7 @@ class LLMRequest:
                    llm_usage_recorder.record_usage_to_database(
                        model_info=model_info,
                        model_usage=usage,
+                        time_cost=time.time() - start_time,
                        user_id="system",
                        request_type=self.request_type,
                        endpoint="/chat/completions",
@@ -331,6 +335,7 @@ class LLMRequest:
            (Tuple[List[float], str]): (嵌入向量，使用的模型名称)
        """
        # 无需构建消息体，直接使用输入文本
+        start_time = time.time()
        model_info, api_provider, client = self._select_model()

        # 请求并处理返回值
@@ -347,6 +352,7 @@ class LLMRequest:
        if usage := response.usage:
            llm_usage_recorder.record_usage_to_database(
                model_info=model_info,
+                time_cost=time.time() - start_time,
                model_usage=usage,
                user_id="system",
                request_type=self.request_type,