docs(requirements): 固化资料包解析确认口径

This commit is contained in:
zhiye.sun
2026-06-03 14:10:20 +08:00
parent 5125f79037
commit 56a332a7dd
7 changed files with 85 additions and 46 deletions

View File

@@ -96,9 +96,10 @@
1. 接收 Documents 模块提供的资料包、批量文件或压缩包解包结果。
2. 遍历当前项目 / 批次所有资料。
3. 保留原始相对路径、文件名、文件类型、页数、页数可信度和处理状态。
4. 识别目录类文档与普通文档
5. 识别章节点、资料名称和是否命中法规目录项
6. 输出目录总表
4. 将压缩包内多层目录按原目录作为章节点识别依据
5. 识别目录类文档与普通文档
6. 识别章节点、资料名称和是否命中法规目录项
7. 输出目录总表。
### 输出要求
@@ -111,6 +112,8 @@
- 已识别章节点
- 待确认文档
DOCX 页数必须精确统计,不能以估算页数作为 V1 验收结果。DOC 如受格式限制无法精确统计,应标记为待人工复核。
## 5.2 法规完整性核查能力
### 目标
@@ -449,8 +452,8 @@ LLM 负责把这些动作组织成自然语言建议,但不能改变底层规
建议工具方向包括:
1. 资料包扫描工具
2. `zip` / `rar` / `7z` 压缩包解包工具
3. 文档页数统计工具
2. `zip` / `rar` / `7z` 压缩包解包工具`rar``7z` 必须采用纯 Python 依赖实现
3. 文档页数统计工具DOCX 页数必须精确统计
4. 章节点识别工具
5. 必交项检查工具
6. 字段抽取工具
@@ -462,7 +465,7 @@ LLM 负责把这些动作组织成自然语言建议,但不能改变底层规
12. 格式模板映射工具
13. Word 模板回填与导出工具
14. 飞书消息摘要生成与通知载荷组装工具
15. 责任人映射解析工具
15. 责任人映射解析工具,首版按资料章节手动配置
16. 规则切片与结构化回写工具
这些工具都应通过 Tool Registry 注册,符合项目既有边界要求。