RAG 项目上线前的 12 项评估清单

@alice 214 views

这是一篇样板 Note,用于测试 KB notes、搜索摘要和个人主页列表。

核心结构:

  1. 检索质量:召回率、Top-K 命中、重复片段。
  2. 生成质量:忠实度、引用覆盖、不可回答识别。
  3. 运营质量:失败样本池、人工复核、灰度发布。

样板标记:sample_kb_seed