Skip to main content

概览

Embedding-3 是智谱AI 推出的第三代文本向量化模型,在前代基础上全面升级,提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度,在保持高质量语义表示的同时,为不同应用场景提供了更优的性能和成本平衡。

价格

0.5 元 / 百万 Tokens

输入模态

文本

输出模态

向量

上下文窗口

8K

向量维度

256-2048(可自定义)

推荐场景

利用更强的语义理解能力,实现更精准的文档检索和问答系统,特别适合专业领域的知识库构建。
结合文本和其他模态信息,构建跨模态的检索系统,支持图文匹配、视频内容检索等复杂场景。
基于用户行为和内容特征的深度理解,提供更个性化和精准的推荐服务,提升用户体验。
深度分析文本内容的主题、情感和意图,用于舆情监控、内容审核和市场分析。
通过语义向量化技术,自动发现实体关系,构建和完善知识图谱,支持复杂的知识推理。

使用资源

体验中心:快速测试模型在业务场景上的效果
接口文档:API 调用方式

详细介绍

1

模型升级

Embedding-3 在架构和训练数据上都进行了重大升级,显著提升了语义理解的准确性和泛化能力。新模型在多个评测基准上都取得了显著的性能提升。核心升级:
  • 增强语义理解:更深层的语义捕捉能力,理解复杂的语言表达
  • 多语言优化:针对中文、英文等多语言场景进行专门优化
  • 领域适应性:在科技、金融、医疗等专业领域表现更佳
  • 鲁棒性提升:对噪声文本和非标准表达有更强的容错能力
2

灵活维度选择

Embedding-3 支持自定义向量维度,用户可以根据具体应用场景选择最适合的维度,在性能和存储成本之间找到最佳平衡。维度选项:
  • 2048维(默认):最高精度,适合对准确性要求极高的场景
  • 1024维:高精度与效率的平衡,适合大多数应用场景
  • 512维:中等精度,适合大规模部署的场景
  • 256维:较高效率,适合实时性要求高的场景
技术参数:
  • 输入字符串数组中,单条请求最多支持 3072 个 Tokens,且数组最大不得超过 64 条

调用示例

以下是一个完整的调用示例,帮助您快速上手 Embedding-3 模型。
  • cURL
  • python
  • Java
  • Python(旧)
  • 响应示例
# 使用默认维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本"
}'

# 自定义维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本",
    "dimensions": 512
}'

最佳实践

根据应用场景选择合适的向量维度:
  • 高精度场景(如法律文档检索):使用2048维
  • 通用应用(如商品推荐):使用1024或512维
  • 实时应用(如在线搜索):使用256维
提升向量化性能的建议:
  • 合理使用批处理,单次最多64条文本
  • 预处理文本以去除无关信息
  • 缓存常用文本的向量结果
  • 根据业务需求选择合适的向量维度
提高向量质量的技巧:
  • 保持输入文本的完整性和上下文
  • 避免过度分割长文本
  • 统一文本格式和编码
  • 定期评估向量质量并调整策略
向量存储的优化建议:
  • 使用适当的向量数据库
  • 建立合适的索引以加速检索
  • 定期清理过期或低质量的向量
  • 考虑向量压缩技术以节省存储空间

用户并发权益

API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0V1V2V3
50100300500
I