127 lines
2.7 KiB
Markdown
127 lines
2.7 KiB
Markdown
# 字段抽取与字段池页原型设计
|
|
|
|
## 1. 页面目标
|
|
|
|
展示从说明书、申请表、产品列表等资料中抽取出的结构化字段,并把来源、置信度、标准值、待复核状态和是否可回填统一展示出来。
|
|
|
|
在最新版原型中,本页对应 `审核智能体` 中“字段抽取”节点的细化视图。
|
|
|
|
## 2. 适用角色
|
|
|
|
- 注册资料专员
|
|
- 数据校对人员
|
|
- 模板回填使用人
|
|
|
|
## 3. 页面布局分区
|
|
|
|
建议采用“顶部摘要 + 中部字段池表格 + 右侧来源证据抽屉”。
|
|
|
|
分区如下:
|
|
|
|
- 顶部:字段抽取统计
|
|
- 中部:字段池主表
|
|
- 下方:待复核字段区
|
|
- 右侧:字段来源详情抽屉
|
|
|
|
## 4. 核心卡片 / 表格 / 状态区
|
|
|
|
### 4.1 抽取摘要卡
|
|
|
|
展示:
|
|
|
|
- 目标字段数量
|
|
- 已抽取数量
|
|
- 待复核字段数量
|
|
- 冲突候选数量
|
|
- 可回填字段数量
|
|
|
|
### 4.2 字段池主表
|
|
|
|
列建议:
|
|
|
|
- 字段编码
|
|
- 中文字段名
|
|
- 标准值
|
|
- 原文值
|
|
- 来源文档
|
|
- 来源位置
|
|
- 抽取方式
|
|
- 置信度
|
|
- 冲突状态
|
|
- 待复核状态
|
|
- 是否可回填
|
|
|
|
### 4.3 待复核区
|
|
|
|
重点突出:
|
|
|
|
- 低置信度字段
|
|
- 长文本归纳字段
|
|
- 来源不唯一字段
|
|
|
|
## 5. 关键字段定义
|
|
|
|
页面主要消费 `registration_field_extraction_report`。
|
|
|
|
关键字段:
|
|
|
|
- `target_field_count`
|
|
- `extracted_field_count`
|
|
- `manual_review_field_count`
|
|
- `conflict_candidate_count`
|
|
- `field_pool_status`
|
|
- `field_pool_items[]`
|
|
- `manual_review_fields[]`
|
|
- `evidence_refs[]`
|
|
|
|
字段池条目关键字段:
|
|
|
|
- `field_key`
|
|
- `field_label`
|
|
- `standard_value`
|
|
- `raw_value`
|
|
- `source_document_name`
|
|
- `source_location`
|
|
- `extract_method`
|
|
- `confidence`
|
|
- `conflict_status`
|
|
- `manual_review_required`
|
|
- `fillable`
|
|
|
|
## 6. 关键交互
|
|
|
|
- 支持按“全部 / 可回填 / 待复核 / 高置信度”切换。
|
|
- 点击字段行打开来源详情。
|
|
- 点击“查看原文片段”展开证据区。
|
|
- 点击“标记推荐值”模拟人工确认。
|
|
- 点击“在对话中查看一致性核查节点”,回到 `审核智能体` 继续主线。
|
|
|
|
## 7. 与上下游页面的数据关系
|
|
|
|
上游:
|
|
|
|
- 来自资料导入页的文档主数据
|
|
- 来自完整性检查页的前置校验状态
|
|
|
|
下游:
|
|
|
|
- 一致性核查页直接使用字段池
|
|
- Word 回填导出页使用可回填字段集
|
|
|
|
## 8. 演示话术重点
|
|
|
|
- 强调统一字段池是后续一致性核查和回填导出的中间事实层。
|
|
- 强调固定字段优先规则抽取,长文本才交给 LLM 辅助归纳。
|
|
- 强调每个字段都有来源,不是“模型猜你要什么”。
|
|
|
|
## 9. 与知识库 / 治理台的关联入口
|
|
|
|
本页应提供:
|
|
|
|
- `维护字段 Schema`
|
|
- `维护字段来源优先级`
|
|
- `查看字段映射规则`
|
|
- `重跑抽取策略`
|
|
|
|
这些入口接入治理台的字段 Schema 和模板映射 CRUD。
|