docs(requirements): 固化资料包解析确认口径
This commit is contained in:
@@ -96,9 +96,10 @@
|
||||
1. 接收 Documents 模块提供的资料包、批量文件或压缩包解包结果。
|
||||
2. 遍历当前项目 / 批次所有资料。
|
||||
3. 保留原始相对路径、文件名、文件类型、页数、页数可信度和处理状态。
|
||||
4. 识别目录类文档与普通文档。
|
||||
5. 识别章节点、资料名称和是否命中法规目录项。
|
||||
6. 输出目录总表。
|
||||
4. 将压缩包内多层目录按原目录作为章节点识别依据。
|
||||
5. 识别目录类文档与普通文档。
|
||||
6. 识别章节点、资料名称和是否命中法规目录项。
|
||||
7. 输出目录总表。
|
||||
|
||||
### 输出要求
|
||||
|
||||
@@ -111,6 +112,8 @@
|
||||
- 已识别章节点
|
||||
- 待确认文档
|
||||
|
||||
DOCX 页数必须精确统计,不能以估算页数作为 V1 验收结果。DOC 如受格式限制无法精确统计,应标记为待人工复核。
|
||||
|
||||
## 5.2 法规完整性核查能力
|
||||
|
||||
### 目标
|
||||
@@ -449,8 +452,8 @@ LLM 负责把这些动作组织成自然语言建议,但不能改变底层规
|
||||
建议工具方向包括:
|
||||
|
||||
1. 资料包扫描工具
|
||||
2. `zip` / `rar` / `7z` 压缩包解包工具
|
||||
3. 文档页数统计工具
|
||||
2. `zip` / `rar` / `7z` 压缩包解包工具,`rar` 和 `7z` 必须采用纯 Python 依赖实现
|
||||
3. 文档页数统计工具,DOCX 页数必须精确统计
|
||||
4. 章节点识别工具
|
||||
5. 必交项检查工具
|
||||
6. 字段抽取工具
|
||||
@@ -462,7 +465,7 @@ LLM 负责把这些动作组织成自然语言建议,但不能改变底层规
|
||||
12. 格式模板映射工具
|
||||
13. Word 模板回填与导出工具
|
||||
14. 飞书消息摘要生成与通知载荷组装工具
|
||||
15. 责任人映射解析工具
|
||||
15. 责任人映射解析工具,首版按资料章节手动配置
|
||||
16. 规则切片与结构化回写工具
|
||||
|
||||
这些工具都应通过 Tool Registry 注册,符合项目既有边界要求。
|
||||
|
||||
Reference in New Issue
Block a user