RAG 项目上线前的 12 项评估清单
@alice
214 views
这是一篇样板 Note,用于测试 KB notes、搜索摘要和个人主页列表。
核心结构:
- 检索质量:召回率、Top-K 命中、重复片段。
- 生成质量:忠实度、引用覆盖、不可回答识别。
- 运营质量:失败样本池、人工复核、灰度发布。
样板标记:sample_kb_seed