深度思考(Thinking)高级推理功能,通过启用思维链(Chain of Thought)机制,让模型在回答问题前进行深层次的分析和推理。这种方式能显著提升模型在复杂任务中的准确性和可解释性,特别适用于需要多步推理、逻辑分析和问题解决的场景。
功能特性
深度思考功能目前支持 GLM-4.5、GLM-4.6 等系列最新模型。通过启用深度思考,模型可以:
- 多步推理:将复杂问题分解为多个步骤,逐步分析解决
- 逻辑分析:提供清晰的推理过程和逻辑链条
- 提升准确性:通过深度思考减少错误,提高回答质量
- 增强可解释性:展示思考过程,让用户理解模型的推理逻辑
- 智能判断:模型自动判断是否需要深度思考,优化响应效率
核心参数说明
thinking.type
: 控制深度思考模式
enabled
(默认):启用动态思考,模型自动判断是否需要深度思考
disabled
:禁用深度思考,直接给出回答
model
: 支持深度思考的模型,如 glm-4.6
、glm-4.5
、glm-4.5v
等
代码示例
基础调用(启用深度思考)curl --location 'https://open.bigmodel.cn/api/paas/v4/chat/completions' \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "glm-4.6",
"messages": [
{
"role": "user",
"content": "详细解释量子计算的基本原理,并分析其在密码学领域的潜在影响"
}
],
"thinking": {
"type": "enabled"
},
"max_tokens": 4096,
"temperature": 1.0
}'
流式调用(深度思考 + 流式输出)curl --location 'https://open.bigmodel.cn/api/paas/v4/chat/completions' \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "glm-4.6",
"messages": [
{
"role": "user",
"content": "设计一个电商网站的推荐系统架构,考虑用户行为、商品特征和实时性要求"
}
],
"thinking": {
"type": "enabled"
},
"stream": true,
"max_tokens": 4096,
"temperature": 1.0
}'
禁用深度思考curl --location 'https://open.bigmodel.cn/api/paas/v4/chat/completions' \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "glm-4.6",
"messages": [
{
"role": "user",
"content": "今天天气怎么样?"
}
],
"thinking": {
"type": "disabled"
}
}'
响应示例
启用深度思考的响应格式:
{
"created": 1677652288,
"model": "glm-4.6",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "人工智能在医疗诊断中具有巨大的应用前景...",
"reasoning_content": "让我从多个角度来分析这个问题。首先,我需要考虑AI在医疗诊断中的技术优势..."
},
"finish_reason": "stop"
}
],
"usage": {
"completion_tokens": 239,
"prompt_tokens": 8,
"prompt_tokens_details": {
"cached_tokens": 0
},
"total_tokens": 247
}
}
最佳实践
推荐启用的场景:
- 复杂问题分析和解决
- 多步骤推理任务
- 技术方案设计
- 策略规划和决策
- 学术研究和分析
- 创意写作和内容创作
可以禁用的场景:
- 简单事实查询
- 基础翻译任务
- 简单分类判断
- 快速问答需求
应用场景
注意事项
- 响应时间:启用深度思考会增加响应时间,特别是复杂任务
- Token 消耗:思考过程会消耗额外的 Token,请合理规划使用
- 模型支持:确保使用支持深度思考功能的模型版本
- 任务匹配:根据任务复杂度选择是否启用深度思考
- 流式输出:结合流式输出可以实时查看思考过程,改善用户体验