GLM-4-Long

概览

GLM-4-Long 是一款专为处理超长文本和记忆型任务而设计的语言模型，支持 1M 超长输入（150-200万字）。

价格

1 元 / 百万 Tokens

输入模态

文本

输出模态

文本

上下文窗口

最大输出 Tokens

使用资源

体验中心：快速测试模型在业务场景上的效果
接口文档：API 调用方式

详细介绍

超长文本处理能力

支持高达1M（约150-200万字）的上下文长度，相当于2本《红楼梦》或125篇论文，在超长文本处理方面的有十分强大的能力。

推理能力

不仅能够阅读和翻译长篇文档，还能够进行全局分析，例如分析财务报告和提取关键信息、合同条款和科研数据。GLM-4-Long 已经具备一定的推理和记忆能力，能够理解和回应复杂的查询，创建具有超长记忆的聊天机器人。

技术关键点

在继续预训练（Continue Pre-Training）、监督微调（SFT）和基于人类反馈的强化学习（RLHF）阶段，进行混合训练逐步扩展上下文长度，从最初的2K上下文支持发展到1M上下文支持。

调用示例

以下是一个完整的调用示例，帮助您快速上手 GLM-4-Long 模型。

Python
Java
Python(旧)

安装 SDK

# 安装最新版本
pip install zai-sdk
# 或指定版本
pip install zai-sdk==0.2.2

验证安装

import zai
print(zai.__version__)

调用示例

from zai import ZhipuAiClient

# 初始化客户端
client = ZhipuAiClient(api_key="your-api-key")

# 创建聊天完成请求
response = client.chat.completions.create(
    model="glm-4-long",
    messages=[
        {"role": "user", "content": "请分析这份长篇技术文档的核心要点和技术架构...[此处可以输入非常长的文档内容]"}
    ]
)

# 获取回复
print(response.choices[0].message.content)

安装 SDKMaven

<dependency>
    <groupId>ai.z.openapi</groupId>
    <artifactId>zai-sdk</artifactId>
    <version>0.3.3</version>
</dependency>

Gradle (Groovy)

implementation 'ai.z.openapi:zai-sdk:0.3.3'

调用示例

import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.model.ChatCompletionCreateParams;
import ai.z.openapi.service.model.ChatCompletionResponse;
import ai.z.openapi.service.model.ChatMessage;
import ai.z.openapi.service.model.ChatMessageRole;
import java.util.Arrays;

public class BasicChat {
    public static void main(String[] args) {
        // 初始化客户端
        ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
            .apiKey("your-api-key")
            .build();

        // 创建聊天完成请求
        ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
            .model("glm-4-long")
            .messages(Arrays.asList(
                ChatMessage.builder()
                    .role(ChatMessageRole.USER.value())
                    .content("请分析这份长篇技术文档的核心要点和技术架构...[此处可以输入非常长的文档内容]")
                    .build()
            ))
            .build();

        // 发送请求
        ChatCompletionResponse response = client.chat().createChatCompletion(request);

        // 获取回复
        if (response.isSuccess()) {
            Object reply = response.getData().getChoices().get(0).getMessage().getContent();
            System.out.println("AI 回复: " + reply);
        } else {
            System.err.println("错误: " + response.getMsg());
        }
    }
}

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your-api-key") # 填写您自己的 APIKey
response = client.chat.completions.create(
    model="glm-4-long",  # 填写需要调用的模型编码
    messages=[
        {"role": "system", "content": "你是一个文档分析专家，擅长从长篇技术文档中提取关键信息和架构要点，能够提供结构化的分析报告。"},
        {"role": "user", "content": "请分析这份长篇技术文档的核心要点和技术架构...[此处可以输入非常长的文档内容]"}
    ],
)
print(response.choices[0].message)

用户并发权益

API 调用会受到速率限制，当前我们限制的维度是请求并发数量（在途请求任务数量）。不同等级的用户并发保障如下。

V0	V1	V2	V3
10	30	40	50

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

概览

价格

输入模态

输出模态

上下文窗口

最大输出 Tokens

推荐场景

使用资源

详细介绍

超长文本处理能力

推理能力

技术关键点

调用示例

用户并发权益

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

​ 概览

价格

输入模态

输出模态

上下文窗口

最大输出 Tokens

​ 推荐场景

​ 使用资源

​ 详细介绍

超长文本处理能力

推理能力

技术关键点

​ 调用示例

​ 用户并发权益

概览

推荐场景

使用资源

详细介绍

调用示例

用户并发权益