Evaluation Studio

案例评估现在区分
云端展示与本地跑批

本地模式下会逐题调用当前问答服务,并按相关性、结构完整性、安全提示等维度实时打分。

评测摘要

模式

待运行

案例数量

0

平均得分

--

运行环境

local

说明

点击上方按钮后,这里会显示当前评测模式说明。云端会优先展示可复用结果,本地则可直接发起实时跑批。

测试结果清单

还没有评测结果。云端环境会自动展示评测样例,本地环境可点击按钮触发实时评测。