40 lines
1.5 KiB
Markdown
40 lines
1.5 KiB
Markdown
# 模型与路由模块需求
|
|
|
|
## 1. 模块目标
|
|
|
|
模型与路由模块负责统一管理模型服务商、模型配置、任务路由、知识库模型绑定和模型调用日志,为 RAG、Workflow、Agent 和 Skill 提供统一模型入口。
|
|
|
|
## 2. 功能需求
|
|
|
|
- 支持配置 Ollama、硅基流动、百炼、OpenAI 和自定义 OpenAI-compatible 服务。
|
|
- 支持维护 Chat、Embedding、Rerank、多模态模型。
|
|
- 支持按任务类型配置主模型、Fallback 模型和路由策略。
|
|
- 支持知识库固定 Embedding 模型、向量维度、切片策略和索引版本。
|
|
- 支持记录模型调用状态、耗时、Token、成本和错误摘要。
|
|
|
|
## 3. 任务类型
|
|
|
|
初始任务类型包括:
|
|
|
|
- RAG 文档向量化。
|
|
- RAG 查询向量化。
|
|
- RAG 问答生成。
|
|
- 简单文本处理。
|
|
- 复杂文本处理。
|
|
- Agent 规划。
|
|
- 重排序。
|
|
|
|
## 4. 验收标准
|
|
|
|
- 业务模块不直接调用上游模型服务。
|
|
- 同一知识库不能混用不同 Embedding 向量空间。
|
|
- 所有调用必须有 `request_id`,方便观测模块追踪。
|
|
- 路由规则禁用时不能被选中。
|
|
|
|
## 5. 关联资料
|
|
|
|
- 表:`model_provider`、`model_config`、`model_route_rule`、`rag_store_model_config`、`model_call_log`
|
|
- 枚举:`model_provider/provider_type`、`protocol_type`、`model_type`、`task_type`、`route_strategy`、`call_status`、`health_status`
|
|
- 脚本:`docs/MODEL_PROVIDER_SCHEMA.sql`、`script/sql/model_provider.sql`
|
|
- 前端原型:`ModelWorkspacePage.vue`
|