Files
DEMO-AGENT/docs/需求分析/3.documents模块需求分析.md

119 lines
2.7 KiB
Markdown

# Documents 模块需求分析
## 1. 模块定位
`apps.documents` 不再只是“文件上传页”,而是:
> 资料包中心
它负责让资料包成为可查询、可绑定会话、可参与审核、可进入知识库和可触发通知的一级业务对象。
## 2. 模块目标
本模块需要支撑以下目标:
1. 接收资料包导入。
2. 识别资料包产品名称。
3. 统计文件数、页数和章节点。
4. 将资料包与对话记录绑定。
5. 支持按产品名称和批次号搜索资料包。
6. 为后续完整性检查、字段抽取和一致性核查提供文档底座。
## 3. 资料包优先原则
V1 以资料包为主对象,而不是单文件。
资料包记录至少需要:
1. `batch_id`
2. `product_name`
3. `conversation_id`
4. `workflow_type`
5. `file_count`
6. `page_count`
7. `chapter_summary`
8. `import_status`
9. `exception_count`
## 4. 产品名称解析要求
资料包导入后需要尽早解析产品名称,用于:
1. 生成会话标题
2. 建立资料包搜索索引
3. 支持同产品批次管理
4. 作为后续字段抽取和一致性核查的主键之一
首版产品名称优先来源:
1. 申请表
2. 说明书
3. 产品列表
若多个来源冲突,可先取主来源值建立会话标题,同时把冲突标记给后续一致性核查处理。
## 5. 支持的导入能力
1. 多文件上传
2. 文件夹导入
3. 压缩包导入
4. 批次追加上传
压缩包仍要求支持:
1. `zip`
2. `rar`
3. `7z`
并保留原始相对路径。
## 6. 页面与交互要求
基于最新版原型,资料包页需要支持:
1. 资料包总览表
2. 产品名称搜索框
3. 按批次号辅助查询
4. 从资料包跳转回对应对话
5. 文件清单与章节点展示
## 7. 搜索需求
资料包页至少应支持:
1. 按产品名称搜索
2. 按批次号搜索
搜索结果应直接返回资料包记录,而不是只返回文件。
## 8. 与对话记录的关系
Documents 模块需要对外提供:
1. `conversation_id`
2. `product_name`
3. `batch_id`
确保:
1. 一个资料包可以定位到一个主会话
2. 一个主会话默认绑定一个资料包
3. 用户可以从资料包页直接跳到会话页
## 9. 与知识库的关系
Documents 管理的是审核资料包;知识库管理的是法规资料、模板资料和业务知识资料。
二者都属于文档资产,但职责不同:
1. 资料包用于当前审核任务事实输入
2. 知识库用于 RAG 检索、法规依据和模板治理
## 10. 验收标准
1. 导入资料包后能形成批次记录。
2. 能解析出产品名称并用于会话标题。
3. 资料包页可按产品名称搜索。
4. 资料包记录能跳转回对应对话。
5. 文件清单、页数和章节点可用于后续审核任务消费。