Documentation Index
Fetch the complete documentation index at: https://docs.bigmodel.cn/llms.txt
Use this file to discover all available pages before exploring further.
GLM-Z1 系列模型已下线,建议选择最新旗舰文本模型 GLM-4.6,该模型同样支持思考模式。
概览
GLM-Z1 系列包含Air、AirX、FlashX、Flash这四个模型。
- GLM-Z1-Air 是一款具备深度思考能力的推理模型。该模型通过推理数据增强和对齐优化,数理推理能力显著增强,适合高频调用场景。GLM-Z1-AirX 为该模型的高速版。
- GLM-Z1-FlashX 具有超快推理速度和更快并发保障,极致性价比,进一步降低推理模型的使用门槛,是免费推理模型 GLM-Z1-Flash 的增强版本。
GLM-Z1-Air
GLM-Z1-AirX
GLM-Z1-FlashX
GLM-Z1-Flash
能力支持
内置深度思考
默认内置深度思考,提供更深层次的推理分析
Function Call
强大的工具调用能力,支持多种外部工具集成
结构化输出
支持 JSON 等结构化格式输出,便于系统集成
MCP
可灵活调用外部 MCP 工具与数据源,扩展应用场景
推荐场景
快速、精准地提取简历中的技能与岗位要求,结合专业度、技能、经验等维度生成量化匹配度报告,为企业招聘提供科学依据。
生成完整剧本内容,覆盖角色对白、场景转换与情节冲突设计等多类型创作需求,支持连续剧集剧情结构与情感的衔接。(推荐与搜索工具结合,获取热点、流行趋势、社会关注,让剧本紧跟潮流)
自动化解析海量文献的核心观点与数据,精准识别跨文献的研究方法异同及结论关联性,输出结构化对比结论与分析报告。
支持用户通过少量的优质小语种种子数据,利用数据合成功能合成大量的类似数据,使得合成的小语种语料不高度相似且不掺杂其他信息。
使用资源
体验中心:快速测试模型在业务场景上的效果
接口文档:API 调用方式
详细介绍
GLM-Z1-Air
GLM-Z1-Air 在 GLM-4-Air-250414 的基础上,采用了冷启动与扩展强化学习策略,并针对数学、代码、逻辑等关键任务进行了深度优化训练。与基础模型相比,GLM-Z1-Air 的数理能力和复杂问题解决能力得到显著增强。此外,训练中整合了基于对战排序反馈的通用强化学习技术,有效提升了模型的通用能力。在部分任务上,GLM-Z1-Air 通过在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中的评估,展现了较强的数理推理能力,能够支持解决更广泛复杂任务。
GLM-Z1-AirX
GLM-Z1-AirX 在训练中整合了基于对战排序反馈的通用强化学习技术,有效提升了模型的通用能力。该模型具备强大的复杂推理能力,在逻辑推理、数学、编程等领域表现优异,推理速度极快远超同类模型。GLM-Z1-AirX 专为高频调用场景设计,在实时数据分析、智能客服等高并发业务中,可实时响应显著降低用户等待耗时。
GLM-Z1-FlashX
GLM-Z1-FlashX 作为轻量化解决方案,在保留 GLM-Z1-Air 完整技术栈的前提下,更轻量级、更高速、更优惠。虽然参数量更少,但 GLM-Z1-FlashX 在数学逻辑推理、长文档处理、代码生成等复杂任务中依然表现出色,整体性能已达到同尺寸开源模型的主流水准。 GLM-Z1-FlashX 为开发者提供低门槛 AI 实验与轻量化部署支持,兼顾推理效率与推理成本,尤其适合高频调用场景。
调用示例
以下是一个完整的调用示例,以 GLM-Z1-Air 模型为例。
cURL
Python
Java
Python(旧)
基础调用curl -X POST "https://open.bigmodel.cn/api/paas/v4/chat/completions" \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-z1-air",
"messages": [
{
"role": "system",
"content": "你是一个擅长创作潮流剧集剧本的 AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"
},
{
"role": "user",
"content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"
}
],
"max_tokens": 4096,
"temperature": 0.7
}'
流式调用curl -X POST "https://open.bigmodel.cn/api/paas/v4/chat/completions" \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-z1-air",
"messages": [
{
"role": "system",
"content": "你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"
},
{
"role": "user",
"content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"
}
],
"max_tokens": 4096,
"temperature": 0.7,
"stream": true
}'
安装 SDK# 安装最新版本
pip install zai-sdk
# 或指定版本
pip install zai-sdk==0.2.2
验证安装import zai
print(zai.__version__)
基础调用from zai import ZhipuAiClient
client = ZhipuAiClient(api_key="your-api-key") # 请填写您自己的 APIKey
response = client.chat.completions.create(
model="glm-z1-air", # 请填写您要调用的模型名称
messages=[
{"role": "system", "content": "你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"},
{"role": "user", "content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"},
],
max_tokens=4096,
temperature=0.7
)
print(response.choices[0].message.content)
流式调用from zai import ZhipuAiClient
client = ZhipuAiClient(api_key="your-api-key") # 请填写您自己的APIKey
stream = client.chat.completions.create(
model="glm-z1-air",
messages=[
{"role": "system", "content": "你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"},
{"role": "user", "content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"},
],
max_tokens=4096,
temperature=0.7,
stream=True
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
安装 SDKMaven<dependency>
<groupId>ai.z.openapi</groupId>
<artifactId>zai-sdk</artifactId>
<version>0.3.3</version>
</dependency>
Gradle (Groovy)implementation 'ai.z.openapi:zai-sdk:0.3.3'
基础调用import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.model.ChatCompletionCreateParams;
import ai.z.openapi.service.model.ChatCompletionResponse;
import ai.z.openapi.service.model.ChatMessage;
import ai.z.openapi.service.model.ChatMessageRole;
import java.util.Arrays;
public class GLMZAirExample {
public static void main(String[] args) {
String apiKey = ""; // 请填写您自己的APIKey
ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
.apiKey(apiKey)
.build();
ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
.model("glm-z1-air")
.messages(Arrays.asList(
ChatMessage.builder()
.role(ChatMessageRole.SYSTEM.value())
.content("你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。")
.build(),
ChatMessage.builder()
.role(ChatMessageRole.USER.value())
.content("创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。")
.build()
))
.maxTokens(4096)
.temperature(0.7f)
.build();
ChatCompletionResponse response = client.chat().createChatCompletion(request);
if (response.isSuccess()) {
Object reply = response.getData().getChoices().get(0).getMessage().getContent();
System.out.println(reply);
} else {
System.err.println("错误: " + response.getMsg());
}
}
}
流式调用import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.model.ChatCompletionCreateParams;
import ai.z.openapi.service.model.ChatCompletionResponse;
import ai.z.openapi.service.model.ChatMessage;
import ai.z.openapi.service.model.ChatMessageRole;
import ai.z.openapi.service.model.Delta;
import java.util.Arrays;
public class GLMZAirStreamExample {
public static void main(String[] args) {
String apiKey = ""; // 请填写您自己的APIKey
ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
.apiKey(apiKey)
.build();
ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
.model("glm-z1-air")
.messages(Arrays.asList(
ChatMessage.builder()
.role(ChatMessageRole.SYSTEM.value())
.content("你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。")
.build(),
ChatMessage.builder()
.role(ChatMessageRole.USER.value())
.content("创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。")
.build()
))
.maxTokens(4096)
.temperature(0.7f)
.stream(true)
.build();
ChatCompletionResponse response = client.chat().createChatCompletion(request);
if (response.isSuccess()) {
response.getFlowable().subscribe(
// Process streaming message data
data -> {
if (data.getChoices() != null && !data.getChoices().isEmpty()) {
Delta delta = data.getChoices().get(0).getDelta();
System.out.print(delta + "\n");
}},
// Process streaming response error
error -> System.err.println("\nStream error: " + error.getMessage()),
// Process streaming response completion event
() -> System.out.println("\nStreaming response completed")
);
} else {
System.err.println("Error: " + response.getMsg());
}
}
}
基础调用import zhipuai
client = ZhipuAI(api_key="your-api-key")
response = client.chat.completions.create(
model="glm-z1-air",
messages=[
{"role": "system", "content": "你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"},
{"role": "user", "content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"}
],
max_tokens=4096,
temperature=0.7
)
print(response.choices[0].message.content)
流式调用import zhipuai
client = ZhipuAI(api_key="your-api-key")
response = client.chat.completions.create(
model="glm-z1-air",
messages=[
{"role": "system", "content": "你是一个擅长创作潮流剧集剧本的AI,生成覆盖角色对白、场景转换与情节冲突设计等多类型创作需求的剧本内容,支持连续剧集剧情结构与情感的衔接,且能紧密结合当下热点、流行趋势和社会关注。"},
{"role": "user", "content": "创作一个围绕当代年轻人创业与情感纠葛的剧集剧本开篇,包含第一集和第二集的内容,要体现当下年轻人对梦想的追求、创业的艰辛,以及复杂的情感关系,可结合2024 - 2025年的热点元素。"}
],
max_tokens=4096,
temperature=0.7,
stream=True
)
for chunk in response:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
用户并发权益
API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
GLM-Z1-Air
GLM-Z1-AirX
GLM-Z1-FlashX
GLM-Z1-Flash