1.5 KiB
1.5 KiB
模型与路由模块需求
1. 模块目标
模型与路由模块负责统一管理模型服务商、模型配置、任务路由、知识库模型绑定和模型调用日志,为 RAG、Workflow、Agent 和 Skill 提供统一模型入口。
2. 功能需求
- 支持配置 Ollama、硅基流动、百炼、OpenAI 和自定义 OpenAI-compatible 服务。
- 支持维护 Chat、Embedding、Rerank、多模态模型。
- 支持按任务类型配置主模型、Fallback 模型和路由策略。
- 支持知识库固定 Embedding 模型、向量维度、切片策略和索引版本。
- 支持记录模型调用状态、耗时、Token、成本和错误摘要。
3. 任务类型
初始任务类型包括:
- RAG 文档向量化。
- RAG 查询向量化。
- RAG 问答生成。
- 简单文本处理。
- 复杂文本处理。
- Agent 规划。
- 重排序。
4. 验收标准
- 业务模块不直接调用上游模型服务。
- 同一知识库不能混用不同 Embedding 向量空间。
- 所有调用必须有
request_id,方便观测模块追踪。 - 路由规则禁用时不能被选中。
5. 关联资料
- 表:
model_provider、model_config、model_route_rule、rag_store_model_config、model_call_log - 枚举:
model_provider/provider_type、protocol_type、model_type、task_type、route_strategy、call_status、health_status - 脚本:
docs/MODEL_PROVIDER_SCHEMA.sql、script/sql/model_provider.sql - 前端原型:
ModelWorkspacePage.vue