docs(requirements): 固化资料包解析确认口径

This commit is contained in:
zhiye.sun
2026-06-03 14:10:20 +08:00
parent 5125f79037
commit 56a332a7dd
7 changed files with 85 additions and 46 deletions

View File

@@ -72,7 +72,7 @@ V1 聚焦“可运行、可讲解、可演示”的注册资料审核闭环,
3. 首版法规校验可以本地规则为主,不强依赖联网抓取最新法规。
4. 首版需要支持飞书内完成任务选择、结果查看和责任人通知,并支持群聊机器人入口及手动维护责任人 / 飞书账号映射。
5. 首版法规任务边界以“注册申报”主流程为核心,变更备案和延续注册暂作为规则扩展方向。
6. 首版如 DOCX / DOC 页数无法精确恢复,可标记为估算页数或待复核,但必须在目录汇总中明确可信度
6. DOCX 页数必须精确统计,不能以估算页数作为 V1 验收结果DOC 如受格式限制无法精确统计,应标记为待复核
7. 回填目标文件在业务未最终确认前,先以结构化回填字段表和模板回填预览作为交付口径。
## 5. 业务闭环
@@ -97,7 +97,9 @@ V1 聚焦“可运行、可讲解、可演示”的注册资料审核闭环,
2. 同步建设结构化规则文件,避免让完整性校验完全依赖检索文本。
3. 提供后台管理页面,支持人工校订和知识库更新。
资料导入层需要按“资料包”而不是“单文件”设计。V1 至少应支持批量文件上传,并预留文件夹导入和压缩包导入能力。压缩包导入建议支持 `zip``rar``7z`,解包后保留原始相对路径,用于生成目录汇总、识别章节点和发现文件夹结构异常
资料导入层需要按“资料包”而不是“单文件”设计。V1 至少应支持批量文件上传文件夹导入和压缩包导入能力。压缩包导入支持 `zip``rar``7z`,解包后保留原始相对路径,并将压缩包内多层目录按原目录作为章节点识别依据。`rar``7z` 解压必须采用纯 Python 实现,允许增加第三方依赖包,避免服务器部署时依赖系统级解压工具
第 2 至第 6 章首版不补充企业真实样本,先以公告附件包进行资料要求、章节点结构和模板口径的规则级初步确认。责任人首版通过后台或配置文件手动维护,并按资料章节配置。
在法规维度上,建议把完整流程理解为: