知识库服务计费说明文档
知识库服务计费
1. 基础知识库服务计费
| 功能项目 | 计费模式 | 模型/产品 | 价格(元/百万Tokens) |
|---|---|---|---|
| 知识向量化 | Token计费 | Embedding-3-pro | 0.5 |
| Embedding-3 | 0.5 | ||
| Embedding-2 | 0.5 | ||
| 开启重排 | Token计费 | GLM-rerank-pro | 0.8 |
| GLM-rerank | 0.8 | ||
| bge-reranker-large | 免费 | ||
| 上下文增强 | Token计费 | GLM-4.5 | 见下方 |
| 深度解析 | 按页计费 | 深度解析服务 | 0.12元/页 |
| 图片理解 | Token计费 | GLM-4.6V-flash | 免费 |
| AI标签生成 | Token计费 | GLM-4.5-flash | 免费 |
| 知识库存储 | 存储量计费 | knowledge_capacity | 0.04元/GB/小时 |
2. 知识库存储计费规则
| 类别 | 子项 | 详细内容 |
|---|---|---|
| 计费规则详情 | 免费额度 |
|
| 超额计费 |
| |
| 计费与结算细则 |
|
| 类别 | 子项 | 详细内容 |
|---|---|---|
| 欠费处理规则 | 第一阶段:欠费 1–7 天 |
|
| 第二阶段:欠费超过 7 天 |
|
3. 上下文增强计费
开启上下文增强功能后,系统将在文件上传并完成解析切片后,对每一张切片单独调用一次 glm-4.5 进行上下文生成。该过程仅在文档处理阶段产生费用,文档处理完成后不再继续扣费。由于每个文档的大小和切片数量不同,实际消耗的 tokens 与费用不固定,最终费用以切片数量及对应模型调用为准。
| 模型 | 输入规格 | 输入单价 | 输出单价 | 缓存存储 | 命中缓存(经测试,上下文增强功能命中率平均 80%,主要参考该价格) |
|---|---|---|---|---|---|
| GLM-4.5 | 输入长度 [0, 32] 输出长度 [0, 0.2] | 2 元/百万 Tokens | 8 元/百万 Tokens | 限时免费 | 0.4 元/百万 Tokens |
| 输入长度 [0, 32] 输出长度 (0.2+) | 3 元/百万 Tokens | 14 元/百万 Tokens | 限时免费 | 0.6 元/百万 Tokens | |
| 输入长度 [32, 128] | 4 元/百万 Tokens | 16 元/百万 Tokens | 限时免费 | 0.8 元/百万 Tokens |