Database unavailable. Test case edits are session-only and will be lost when you close this tab.

LLM Bench

Compare LLM endpoints

基础对话
测试模型基本响应能力,中英文输出
实体提取
从邮件中提取人名、公司名、日期,输出 JSON
语气/风格建模
分析邮件的写作风格、正式程度、用词习惯
邮件草稿生成
根据要求生成完整邮件,测试综合写作能力
长上下文理解
阅读会议纪要并回答问题,测试信息提取和理解能力
POST
/v1/chat/completions
Target Endpoints
No endpoints configured
Messages
user
Hello! 请用中英文各一句话介绍你自己。
Raw Request
{
  "model": "<model>",
  "messages": [
    {
      "role": "user",
      "content": "Hello! 请用中英文各一句话介绍你自己。"
    }
  ]
}

Run a test to see results