docs(详细设计): 新增字段抽取与字段池设计
This commit is contained in:
89
docs/详细设计/skill/字段抽取报告生成Skill.md
Normal file
89
docs/详细设计/skill/字段抽取报告生成Skill.md
Normal file
@@ -0,0 +1,89 @@
|
||||
# 字段抽取报告生成Skill 设计
|
||||
|
||||
## 1. Skill 定位
|
||||
|
||||
`字段抽取报告生成Skill` 负责将字段池写入结果组装成稳定的 `registration_field_extraction_report`,并生成页面展示、审计和飞书摘要所需的数据结构。
|
||||
|
||||
英文实现标识建议使用 `FieldExtractionReportBuildSkill`。
|
||||
|
||||
## 2. 输入
|
||||
|
||||
```python
|
||||
@dataclass
|
||||
class FieldExtractionReportBuildInput:
|
||||
context: FieldExtractionContext
|
||||
field_pool_items: list[FieldPoolItem]
|
||||
manual_review_fields: list[dict]
|
||||
tool_calls: list[dict]
|
||||
```
|
||||
|
||||
## 3. 输出
|
||||
|
||||
```python
|
||||
@dataclass
|
||||
class FieldExtractionReportBuildOutput:
|
||||
report: dict
|
||||
display_sections: list[dict]
|
||||
audit_payload: dict
|
||||
feishu_summary_payload: dict
|
||||
```
|
||||
|
||||
## 4. 报告结构
|
||||
|
||||
报告必须包含:
|
||||
|
||||
1. `report_type`
|
||||
2. `batch_id`
|
||||
3. `field_schema_id`
|
||||
4. `field_schema_version`
|
||||
5. `summary`
|
||||
6. `field_pool_items`
|
||||
7. `manual_review_fields`
|
||||
8. `evidence_refs`
|
||||
9. `tool_calls`
|
||||
|
||||
## 5. 核心方法
|
||||
|
||||
### 5.1 `run(input) -> FieldExtractionReportBuildOutput`
|
||||
|
||||
主入口方法。
|
||||
|
||||
### 5.2 `build_summary(field_pool_items) -> dict`
|
||||
|
||||
汇总字段数量、已抽取数量、待复核数量和冲突候选数量。
|
||||
|
||||
### 5.3 `build_field_rows(field_pool_items) -> list[dict]`
|
||||
|
||||
生成字段池页面表格。
|
||||
|
||||
### 5.4 `build_audit_payload(report, context) -> dict`
|
||||
|
||||
生成审计载荷。
|
||||
|
||||
### 5.5 `build_feishu_summary_payload(report) -> dict`
|
||||
|
||||
生成飞书摘要载荷。
|
||||
|
||||
## 6. 技术实现
|
||||
|
||||
使用技术:
|
||||
|
||||
1. dataclass/Pydantic
|
||||
2. JSONField
|
||||
3. Audit 服务
|
||||
4. 页面展示 schema
|
||||
|
||||
## 7. 异常处理
|
||||
|
||||
1. 字段池为空:输出空报告并提示无可用字段。
|
||||
2. 报告字段缺失:任务失败。
|
||||
3. 审计写入失败:报告仍返回,但记录系统警告。
|
||||
4. 飞书摘要构建失败:不影响 Web 报告。
|
||||
|
||||
## 8. 测试要点
|
||||
|
||||
1. 输出 schema 稳定。
|
||||
2. 字段池行展示完整。
|
||||
3. 审计载荷包含字段 schema 版本。
|
||||
4. 飞书摘要不包含敏感信息。
|
||||
|
||||
Reference in New Issue
Block a user