1. 产品概述
GLM 全模态知识库是一款面向企业和团队的智能知识管理平台,支持将文本、图片、音频、视频等多种格式的文件统一存储到知识库中,并通过自然语言提问即可快速跨模态检索相关内容。| 类型 | 说明 |
|---|---|
| 📄 文本检索 | 支持 PDF / Word / TXT / CSV 等文档全文语义检索 |
| 🖼️ 图片检索 | 上传图片作为查询条件,匹配知识库中的相似内容 |
| 🎵 音频检索 | 对音频片段建立索引,返回相关时间段内容 |
| 🎬 视频检索 | 对视频内容建立索引,精准定位相关片段并可播放 |
2. 快速上手
按照以下 4 步即可完成从创建到检索的完整流程:3. 知识库管理
3.1 创建知识库
配置知识库参数
在知识库首页点击「+ 创建知识库」,在弹出面板中完成以下配置:| 参数 | 描述 |
|---|---|
| 知识库版本 | 1. 全模态版 - 当选择的向量模型为全模态向量模型 - 使用场景: - 音视频等各模态数据 - 复杂问题查询 - 文档包含复杂图文信息 - 支持语义补全或指代增强等高精度要求的业务场景 2. 文本版 - 当选择的向量模型为文本向量模型,且导入知识非问答对格式 - 使用场景:单一文本模态信息查询 3. QA版 - 导入的知识为问答对格式 - 系统将根据文档格式自动将该知识库识别为QA版 - 使用场景: - 精准匹配问题与答案 - 适合结构化的知识体系 |
| 图标 | 为知识库选择一个独特的图标,便于在列表中快速识别和管理。 |
| 知识库名称 | 为您的知识库起一个清晰、唯一的名字。支持中英文、数字及常用符号。 |
| 知识库描述 | 填写知识范围、用途等信息,建议仔细填写该栏以便于模型调用。 |
| 向量化模型 | 「全模态版」支持图片/音视频解析;「文本版」仅处理文档。选择合适的模型来理解您的数据。不同模型在性能、多语言能力和成本上有所差异。 |
| 知识库分类 | 将知识库归入指定分类,方便进行结构化、多层级的管理。 |
| 增强设置 (⚠️ 仅对文档类文件生效,不支持处理音图视频文件) | 1. 上下文增强 启用后,系统将保留文档中的关键语义与指代信息,提升复杂问答和精确信息检索的效果。 在高准确度场景下,平均召回率提升约20%,适用于复杂问答、精确信息检索等场景启用后会增加glm-4.5的Tokens消耗和时间,请确认资源充足。 此操作不可逆,启用后无法回退。 2. 深度解析 适合复杂版面分析、表格、公式,按页计费 0.12 元/页 启用后,该知识库内所有文档将调用前沿专业版文件解析服务,提升解析精度 该操作可逆,对于已解析的文件,关闭后再次开启,不会重复解析及扣费。 3. 图片理解 调用多模态大模型为图片生成文字描述,消耗 glm-4.5v tokens 该操作可逆。 |
3.2 知识库列表
知识库首页列表
知识库首页以卡片形式展示所有知识库,每张卡片包含以下信息:- 知识库名称与类型标签(QA版 / 文本版 / 全模态版)
- 知识库 ID(支持一键复制)
- 更新时间 / 文档数量 / 切片数量
- 快捷操作入口:知识检索、知识问答
3.3 导入知识
进入知识库后,点击「+ 导入知识」,支持四种导入方式:
| 方式 | 说明 | 限制 / 备注 |
|---|---|---|
| 本地文档 | 从本机上传文件,上传后可查看进度与处理状态 - 支持文档格式:pdf、docx、doc、pptx、ppt、txt、md、xlsx、xls、csv,单文件不超过 100MB - 支持图片格式:jpeg, png, webp,单张不超过 5 MB - 支持视频格式:mp4, avi, mov,单条时长不超过 15 分钟 - 支持音频格式:pcm, wav, mp3, ogg,单条时长不超过 30 分钟 | 单文档文件 ≤ 100MB 单张图片 ≤ 5MB 音视频 ≤ 15分钟 |
| URL | 填写网络地址直接抓取网页内容,不支持通过该方式上传或导入文件资源 | — |
| 飞书文档 | 连接飞书账号后导入在线文档 | 需先完成飞书账号授权 |
| 问答对 | 直接上传 Q&A 对,适合构建问答型知识库 | — |
3.4 知识状态
文档列表页
文件上传后,在文档列表页可查看每个文件的处理状态:| 状态 | 说明 |
|---|---|
| 数据处理中 | 文件正在解析和建立向量索引,此阶段暂不可检索 |
| 索引构建中 | 向量索引写入中,即将可用 |
| 处理完成 | 文件已就绪,可以被正常检索 |
| 图片解析中 | 图片文件正在进行多模态理解,生成文字描述(开启图片理解后可见) |
| 数据异常 | 处理失败,可点击刷新图标重试 |
4. 知识检索
4.1 检索入口
入口一:文档列表页
入口二:知识库卡片页
4.2 检索方式
知识检索主界面
支持三种查询输入方式:| 方式 | 说明 |
|---|---|
| 文字检索 | 在输入框输入自然语言问题,系统匹配相关文档片段 |
| 图片检索 | 上传图片后以图片内容作为查询条件,跨模态匹配 |
| 组合检索 | 同时输入图片和文字,进行联合跨模态检索 |
4.3 检索参数配置
点击右侧「检索参数设置」面板,可调整以下参数:| 参数 | 说明 | 默认值 |
|---|---|---|
| 问题改写 | 开启「问题改写」后,系统会在检索前对用户输入的问题进行智能改写,展示在输入框下方的「改写后问题」区域,改写内容包括: - 补充问题背景与语境 - 同义表达扩展,提升召回率 - 点击可展开查看完整改写内容 问题改写功能界面 | 关闭 |
| QA干预 | 优先从 QA 知识库匹配问答对,可设置分数阈值 | 关闭,默认值 0.6 |
| Rerank | 对召回结果重排序,提升结果精准度 | 开启 |
| 召回数量 | 控制最多返回的结果条数 | 8 |
| 召回分数 | 设置最低相似度阈值,低于该值的结果不返回 | 0.3 |
| 文本检索方式 | - 向量检索:纯向量相似度匹配 - 关键词检索:通过关键词匹配 - 混合检索:向量检索 + 关键词检索结合,最优匹配;可调检索配比 | 混合检索,配比 0.8 |
4.4 检索结果说明
检索结果列表
每条检索结果包含以下信息:- 重排分数 / 重排位次 / 召回分数 / 召回位次
- 文件名称与文件类型图标
- 文档片段内容预览(支持「展开」查看完整内容)
- 音视频结果:显示对应时间段缩略图,支持直接在页面内播放
4.5 音视频内容检索
4.5.1 视频检索
视频检索结果(含时间段预览)
当知识库中包含视频文件时,系统对视频内容建立多模态索引。检索后结果中将显示视频缩略图及精确时间段(如00:22~00:38),点击可在页面内直接播放对应片段。
4.5.2 音频检索
音频检索结果(含播放控件)
音频文件同样支持语义检索。结果中显示音频文件名、对应时间段与内容摘要,点击后在页面底部展开音频播放控件,可直接收听相关片段。

