-
Notifications
You must be signed in to change notification settings - Fork 2.5k
Open
Description
📋 Feature Description
支持通过配置控制 Gemini 模型的思考模式(Thinking Mode),允许用户关闭或限制思考 token 预算。
🎯 Problem to Solve
Gemini 2.0 Flash Thinking 等模型默认启用思考模式,会消耗额外 token 并增加延迟。某些场景下用户希望关闭思考以降低成本和响应时间。
💡 Proposed Solution
在请求中添加 thinkingConfig 参数:
{
"thinkingConfig": {
"thinkingBudget": 0
}
}0= 关闭思考- 正整数 = 限制思考 token 数量
🔧 Technical Details
mcp/request.go: 添加ThinkingConfig结构体字段mcp/config.go: 添加配置选项- 前端: AI 模型配置页面添加开关
✅ Acceptance Criteria
- Request 结构支持 thinkingConfig 参数
- 用户可通过配置或 UI 控制思考模式
- 仅对支持思考的 Gemini 模型生效
📚 Additional Context
符合 Roadmap 1.2 增强AI能力方向。
Metadata
Metadata
Assignees
Labels
No labels