概述
私有实例部署(Private Instance Deployment)是指将大模型在专属的计算资源上进行独立部署,以满足企业对数据安全、性能隔离、个性化定制和资源可控性的需求。
什么是私有模型部署?
与共享公共模型服务不同,私有实例部署为客户提供了专属的运行环境和服务能力,确保模型调用不会受到其他用户的干扰,同时支持更灵活的配置与扩展。独享算力
专属 GPU/CPU 资源,避免多租户带来的性能抖动
可控访问
结合 VPC、内网、白名单等安全策略,保障数据传输安全
可定制化
支持模型参数、微调版本、推理配置等定制化需求
高可用与扩展性
支持水平扩展、负载均衡及容灾部署,保障高并发与稳定性
何时使用私有实例部署?
模型私有实例部署通常适用于以下场景:- 高安全性要求的业务场景: 例如金融、医疗、政企等对数据合规与隐私保护要求严格的行业
- 大规模并发调用: 当业务需要大规模、高频次调用时,私有实例能提供更稳定的吞吐能力
- 性能隔离需求: 确保关键业务调用不受其他用户的影响,保障 SLA
- 个性化模型定制: 如需要长期运行经过专属数据微调的模型,并保证其仅对特定应用服务
- 成本可控与长期使用: 适合有长期稳定需求的客户,相比公有实例调用可优化成本结构
哪些模型可以私有实例部署?
当前支持部署的模型包括:- 智谱官方模型: GLM-4.5-Air、GLM-4-Plus、GLM-4-0520、GLM-4-Air、GLM-4-Flash 等
- 微调后的模型: 基于客户数据完成微调后的专属模型
如何进行部署
1. 模型部署入口
在私有实例页面点击”创建部署任务”按钮,选择要部署的基础模型/微调模型。

你可以根据实际使用场景的并发需求选择部署实例的数量。实例部署需要一定时间(通常为10-30分钟,具体取决于模型大小)。我们会在部署完成后通过短信通知你。


2. 模型实例变更与取消部署
操作实例变更与模型部署取消
您可以在模型广场的模型详情页或在私有实例页面选择已经部署的模型进行实例数量变更或者取消部署。取消部署动作将在操作后立即生效,取消后该部署模型无法再进行调用。


3. 模型推理
模型编码获取
您可以在私有实例页面直接复制模型编码。
模型调用
你可以通过体验中心或 API 使用模型。在进行 API 请求时,你可以将你命名的新的模型代码作为model
参数的值传递。
调用示例
安装 SDK
验证安装
使用示例
部署计费说明
计费规则
- 首次部署: 实时扣减算力单元额度,后续每日凌晨扣减当日所需消耗算力单元
- 示例: A模型部署1个实例,单实例算力单元2。今日下午16:30部署一个实例成功,则部署成功后扣减2个算力单元。次日起,每日凌晨扣减2个算力单元
- 取消部署: 选择取消/减少实例时,次日起不再扣减对应实例的算力单元