1.9 KiB
1.9 KiB
字段抽取报告生成Skill 设计
1. Skill 定位
字段抽取报告生成Skill 负责将字段池写入结果组装成稳定的 registration_field_extraction_report,并生成页面展示、审计和飞书摘要所需的数据结构。
英文实现标识建议使用 FieldExtractionReportBuildSkill。
2. 输入
@dataclass
class FieldExtractionReportBuildInput:
context: FieldExtractionContext
field_pool_items: list[FieldPoolItem]
manual_review_fields: list[dict]
tool_calls: list[dict]
3. 输出
@dataclass
class FieldExtractionReportBuildOutput:
report: dict
display_sections: list[dict]
audit_payload: dict
feishu_summary_payload: dict
4. 报告结构
报告必须包含:
report_typebatch_idfield_schema_idfield_schema_versionsummaryfield_pool_itemsmanual_review_fieldsevidence_refstool_calls
5. 核心方法
5.1 run(input) -> FieldExtractionReportBuildOutput
主入口方法。
5.2 build_summary(field_pool_items) -> dict
汇总字段数量、已抽取数量、待复核数量和冲突候选数量。
5.3 build_field_rows(field_pool_items) -> list[dict]
生成字段池页面表格。
5.4 build_audit_payload(report, context) -> dict
生成审计载荷。
5.5 build_feishu_summary_payload(report) -> dict
生成飞书摘要载荷。
6. 技术实现
使用技术:
- dataclass/Pydantic
- JSONField
- Audit 服务
- 页面展示 schema
7. 异常处理
- 字段池为空:输出空报告并提示无可用字段。
- 报告字段缺失:任务失败。
- 审计写入失败:报告仍返回,但记录系统警告。
- 飞书摘要构建失败:不影响 Web 报告。
8. 测试要点
- 输出 schema 稳定。
- 字段池行展示完整。
- 审计载荷包含字段 schema 版本。
- 飞书摘要不包含敏感信息。