Files
DEMO-AGENT/docs/需求分析/3.documents模块需求分析.md

2.7 KiB

Documents 模块需求分析

1. 模块定位

apps.documents 不再只是“文件上传页”,而是:

资料包中心

它负责让资料包成为可查询、可绑定会话、可参与审核、可进入知识库和可触发通知的一级业务对象。

2. 模块目标

本模块需要支撑以下目标:

  1. 接收资料包导入。
  2. 识别资料包产品名称。
  3. 统计文件数、页数和章节点。
  4. 将资料包与对话记录绑定。
  5. 支持按产品名称和批次号搜索资料包。
  6. 为后续完整性检查、字段抽取和一致性核查提供文档底座。

3. 资料包优先原则

V1 以资料包为主对象,而不是单文件。

资料包记录至少需要:

  1. batch_id
  2. product_name
  3. conversation_id
  4. workflow_type
  5. file_count
  6. page_count
  7. chapter_summary
  8. import_status
  9. exception_count

4. 产品名称解析要求

资料包导入后需要尽早解析产品名称,用于:

  1. 生成会话标题
  2. 建立资料包搜索索引
  3. 支持同产品批次管理
  4. 作为后续字段抽取和一致性核查的主键之一

首版产品名称优先来源:

  1. 申请表
  2. 说明书
  3. 产品列表

若多个来源冲突,可先取主来源值建立会话标题,同时把冲突标记给后续一致性核查处理。

5. 支持的导入能力

  1. 多文件上传
  2. 文件夹导入
  3. 压缩包导入
  4. 批次追加上传

压缩包仍要求支持:

  1. zip
  2. rar
  3. 7z

并保留原始相对路径。

6. 页面与交互要求

基于最新版原型,资料包页需要支持:

  1. 资料包总览表
  2. 产品名称搜索框
  3. 按批次号辅助查询
  4. 从资料包跳转回对应对话
  5. 文件清单与章节点展示

7. 搜索需求

资料包页至少应支持:

  1. 按产品名称搜索
  2. 按批次号搜索

搜索结果应直接返回资料包记录,而不是只返回文件。

8. 与对话记录的关系

Documents 模块需要对外提供:

  1. conversation_id
  2. product_name
  3. batch_id

确保:

  1. 一个资料包可以定位到一个主会话
  2. 一个主会话默认绑定一个资料包
  3. 用户可以从资料包页直接跳到会话页

9. 与知识库的关系

Documents 管理的是审核资料包;知识库管理的是法规资料、模板资料和业务知识资料。

二者都属于文档资产,但职责不同:

  1. 资料包用于当前审核任务事实输入
  2. 知识库用于 RAG 检索、法规依据和模板治理

10. 验收标准

  1. 导入资料包后能形成批次记录。
  2. 能解析出产品名称并用于会话标题。
  3. 资料包页可按产品名称搜索。
  4. 资料包记录能跳转回对应对话。
  5. 文件清单、页数和章节点可用于后续审核任务消费。