1.2 KiB
1.2 KiB
3. 字段抽取与统一字段池详细设计
1. 设计目标
本步骤负责从说明书、申请表、产品列表等资料中抽取关键字段,并写入统一字段池,供一致性核查、风险判断和 Word 回填复用。
2. 输入
batch_idconversation_idproduct_namedocument_scopefield_schemasource_priority
3. 字段池模型
字段项至少包含:
field_codefield_namefield_valuesource_document_idsource_locationconfidencereview_statusfillable
4. 抽取策略
- 规则抽取显式字段
- 表格抽取规格与结构化字段
- LLM 归纳长文本字段
- 来源优先级合并同名字段
5. 输出对象
registration_field_extraction_report 至少包含:
field_itemssource_documentslow_confidence_itemsfillable_items
6. 对话节点要求
字段抽取节点应展示:
- 已抽取字段数
- 待复核字段数
- 关键字段来源
- 是否可回填
7. 验收标准
- 统一字段池可支撑后续一致性核查和回填。
- 低置信度字段有明确待复核标记。
- 对话中可解释字段来源和采用逻辑。