Skip to main content

1. 产品概述

GLM 全模态知识库是一款面向企业和团队的智能知识管理平台,支持将文本、图片、音频、视频等多种格式的文件统一存储到知识库中,并通过自然语言提问即可快速跨模态检索相关内容。
类型说明
📄 文本检索支持 PDF / Word / TXT / CSV 等文档全文语义检索
🖼️ 图片检索上传图片作为查询条件,匹配知识库中的相似内容
🎵 音频检索对音频片段建立索引,返回相关时间段内容
🎬 视频检索对视频内容建立索引,精准定位相关片段并可播放

2. 快速上手

按照以下 4 步即可完成从创建到检索的完整流程:
1

创建知识库

进入知识库页面,点击右上角「+ 创建知识库」,填写名称与描述后保存。
2

导入文件

支持本地上传、URL、飞书文档、问答对等多种方式导入知识内容。
3

等待处理

系统自动完成解析与索引构建,文件状态变为「数据完成」后即可检索。
4

开始检索

点击「知识检索」,输入自然语言问题或上传图片,查看匹配结果。

3. 知识库管理

3.1 创建知识库

1

创建知识库

Description
2

配置知识库参数

Description在知识库首页点击「+ 创建知识库」,在弹出面板中完成以下配置:
参数描述
知识库版本1. 全模态版
- 当选择的向量模型为全模态向量模型
- 使用场景:
    - 音视频等各模态数据
    - 复杂问题查询
    - 文档包含复杂图文信息
    - 支持语义补全或指代增强等高精度要求的业务场景

2. 文本版
- 当选择的向量模型为文本向量模型,且导入知识非问答对格式
- 使用场景:单一文本模态信息查询

3. QA版
- 导入的知识为问答对格式
- 系统将根据文档格式自动将该知识库识别为QA版
- 使用场景:
    - 精准匹配问题与答案
    - 适合结构化的知识体系
图标为知识库选择一个独特的图标,便于在列表中快速识别和管理。
知识库名称为您的知识库起一个清晰、唯一的名字。支持中英文、数字及常用符号。
知识库描述填写知识范围、用途等信息,建议仔细填写该栏以便于模型调用。
向量化模型「全模态版」支持图片/音视频解析;「文本版」仅处理文档。选择合适的模型来理解您的数据。不同模型在性能、多语言能力和成本上有所差异。
知识库分类将知识库归入指定分类,方便进行结构化、多层级的管理。
增强设置
(⚠️ 仅对文档类文件生效,不支持处理音图视频文件)
1. 上下文增强
启用后,系统将保留文档中的关键语义与指代信息,提升复杂问答和精确信息检索的效果。
在高准确度场景下,平均召回率提升约20%,适用于复杂问答、精确信息检索等场景启用后会增加glm-4.5的Tokens消耗和时间,请确认资源充足。
此操作不可逆,启用后无法回退。

2. 深度解析
适合复杂版面分析、表格、公式,按页计费 0.12 元/页
启用后,该知识库内所有文档将调用前沿专业版文件解析服务,提升解析精度
该操作可逆,对于已解析的文件,关闭后再次开启,不会重复解析及扣费。

3. 图片理解
调用多模态大模型为图片生成文字描述,消耗 glm-4.5v tokens
该操作可逆。
3

选择向量化模型(用于区分知识库类型)

Description
  • Embedding-3-pro (文本推荐): 性能最强,支持多语言,性价比高。(0.5元/百万Tokens)
  • Embedding-Multimodel(全模态旗舰): 模态覆盖全,支持多语言,当前免费。
  • Embedding-3: 性能均衡,适用于多数场景。(0.5元/百万Tokens)
  • Embedding-2: 基础模型。(0.5元/百万Tokens)

3.2 知识库列表

Description

知识库首页列表

知识库首页以卡片形式展示所有知识库,每张卡片包含以下信息:
  • 知识库名称与类型标签(QA版 / 文本版 / 全模态版
  • 知识库 ID(支持一键复制)
  • 更新时间 / 文档数量 / 切片数量
  • 快捷操作入口:知识检索、知识问答

3.3 导入知识

Description Description 进入知识库后,点击「+ 导入知识」,支持四种导入方式:
方式说明限制 / 备注
本地文档
从本机上传文件,上传后可查看进度与处理状态
- 支持文档格式:pdf、docx、doc、pptx、ppt、txt、md、xlsx、xls、csv,单文件不超过 100MB
- 支持图片格式:jpeg, png, webp,单张不超过 5 MB
- 支持视频格式:mp4, avi, mov,单条时长不超过 15 分钟
- 支持音频格式:pcm, wav, mp3, ogg,单条时长不超过 30 分钟
单文档文件 ≤ 100MB
单张图片 ≤ 5MB
音视频 ≤ 15分钟
URL填写网络地址直接抓取网页内容,不支持通过该方式上传或导入文件资源
飞书文档连接飞书账号后导入在线文档需先完成飞书账号授权
问答对直接上传 Q&A 对,适合构建问答型知识库

3.4 知识状态

Description

文档列表页

文件上传后,在文档列表页可查看每个文件的处理状态:
状态说明
数据处理中文件正在解析和建立向量索引,此阶段暂不可检索
索引构建中向量索引写入中,即将可用
处理完成文件已就绪,可以被正常检索
图片解析中图片文件正在进行多模态理解,生成文字描述(开启图片理解后可见)
数据异常处理失败,可点击刷新图标重试
仅文档类文件支持调优操作:切片(查看解析结果)/ 配置(调整切片设置)文档列表支持按文件类型筛选(文档文件 / 图片文件 / 视频文件 / 音频文件)及按处理状态过滤。

4. 知识检索

4.1 检索入口

Description

入口一:文档列表页

Description

入口二:知识库卡片页

4.2 检索方式

Description

知识检索主界面

支持三种查询输入方式:
方式说明
文字检索在输入框输入自然语言问题,系统匹配相关文档片段
图片检索上传图片后以图片内容作为查询条件,跨模态匹配
组合检索同时输入图片和文字,进行联合跨模态检索

4.3 检索参数配置

点击右侧「检索参数设置」面板,可调整以下参数:
参数说明默认值
问题改写开启「问题改写」后,系统会在检索前对用户输入的问题进行智能改写,展示在输入框下方的「改写后问题」区域,改写内容包括:
- 补充问题背景与语境
- 同义表达扩展,提升召回率
- 点击可展开查看完整改写内容
改写功能适合口语化提问场景,当用户提问过于简短或模糊时效果显著。
Description

问题改写功能界面

关闭
QA干预优先从 QA 知识库匹配问答对,可设置分数阈值关闭,默认值 0.6
Rerank对召回结果重排序,提升结果精准度开启
召回数量控制最多返回的结果条数8
召回分数设置最低相似度阈值,低于该值的结果不返回0.3
文本检索方式
- 向量检索:纯向量相似度匹配
- 关键词检索:通过关键词匹配
- 混合检索:向量检索 + 关键词检索结合,最优匹配;可调检索配比
混合检索,配比 0.8

4.4 检索结果说明

Description

检索结果列表

每条检索结果包含以下信息:
  • 重排分数 / 重排位次 / 召回分数 / 召回位次
  • 文件名称与文件类型图标
  • 文档片段内容预览(支持「展开」查看完整内容)
  • 音视频结果:显示对应时间段缩略图,支持直接在页面内播放

4.5 音视频内容检索

4.5.1 视频检索

Description

视频检索结果(含时间段预览)

当知识库中包含视频文件时,系统对视频内容建立多模态索引。检索后结果中将显示视频缩略图及精确时间段(如 00:22~00:38),点击可在页面内直接播放对应片段。

4.5.2 音频检索

Description

音频检索结果(含播放控件)

音频文件同样支持语义检索。结果中显示音频文件名、对应时间段与内容摘要,点击后在页面底部展开音频播放控件,可直接收听相关片段。

5. 注意事项

使用前请注意:
  1. 文件需等待处理完成才可检索——大文件处理时间较长,请耐心等待状态变为「处理完成」。
  2. 深度解析按页计费——0.12 元/页,适合格式复杂的 PDF,普通文档无需开启。
  3. 注意存储空间——免费存储空间为 1GB,用量超过 70% 时建议清理无用文件或升级套餐。
  4. 知识库计费说明——详见对应文档