结构化抽取 - qKnow 开源版
2026/3/18大约 6 分钟用户手册
功能概览
结构化抽取模块是 qKnow 开源版中用于从结构化数据中提取知识的核心功能,为用户提供从数据库结构化数据源中提取实体、关系和属性信息的能力。
主要特性
- 📊 多数据源支持:支持从 MySQL 关系型数据库中提取数据
- 🔧 自定义抽取规则:支持用户根据业务需求定义抽取规则,灵活配置数据映射关系
- ⚡ 高效抽取:采用优化的抽取算法,快速处理大规模结构化数据
- 📋 抽取任务管理:支持创建、编辑、删除抽取任务,实时监控任务执行状态
- 📈 抽取结果可视化:直观展示抽取结果,便于用户验证和分析
操作指南
结构化抽取页面
点击【知识抽取】→【结构化抽取】,进入结构化抽取页面。该页面展示所有已配置的抽取任务,支持任务的新增、编辑、删除和执行等操作。

新增结构化抽取任务
1. 点击「新增」按钮
页面弹出 “添加结构化抽取任务” 弹窗,进入配置流程。

2. 填写基础信息
| 字段 | 说明 | 是否必填 |
|---|---|---|
| 任务名称 | 输入抽取任务的名称 | 是 |
| 数据源 | 选择要抽取的数据源;点击「测试连接」验证连通性 | 是 |
| 更新类型 | 选择数据更新方式(如全量/增量) | 否 |
| 更新频率 | 设置更新周期,支持 cron 表达式;点击「生成」可辅助填写 | 否 |
| 备注 | 补充说明 | 否 |
💡 完成后点击 「下一步」进入表映射配置。

3. 配置表映射
导入数据表
点击「导入表」按钮,在弹窗中选择已配置的数据源。
系统将自动加载该数据源下的所有数据表。设置属性映射
对已导入的表,点击其右侧的「映射」按钮,打开 “数据映射 - 属性映射” 弹窗,并完成以下配置:
| 配置项 | 说明 |
|---|---|
| 概念 | 选择当前数据表所映射的实体概念(如“客户”“设备”等) |
| 实体名称字段 | 选择用于在图谱中显示实体名称的字段(如 name、title) |
| 主键 | 选择唯一标识记录的字段(通常为 id 或 uuid) |
| 字段映射 | 为每个数据表字段从下拉列表中选择对应的概念属性 |
⚠️ 注意:若所选概念尚未定义属性,请先前往「概念配置」中补充属性定义。
💡 所有表映射完成后,点击「下一步」进入关系映射配置。


关系映射配置
配置知识图谱中概念与概念之间的关联关系。系统支持一对一/一对多和多对多两种模式。
💡 前提:
- 至少两个表已完成属性映射(即已指定对应的概念)
- 数据源已成功连接,且包含所需的关联字段或中间表
1. 新增关系映射
点击「新增关系映射」按钮,打开配置弹窗。
2. 选择关系类型并填写信息
| 字段 | 说明 |
|---|---|
| 关系类型 | 一对一 / 一对多:直接通过外键关联两张主表 • 多对多:通过第三张中间表关联 |
| 源概念 | 选择关系起点的概念(来自已映射的表) |
| 源表关联字段 | 选择用于关联的字段: • 若为“一对一/一对多”:选源表的外键字段 • 若为“多对多”:选中间表中指向源概念主键的字段 |
| 关系 | 选择预定义的关系类型(如“收藏”“参与”等) |
| 目标概念 | 选择关系终点的概念 |
| 目标表关联字段 | 选择用于关联的字段: • 若为“一对一/一对多”:选目标表的主键字段 • 若为“多对多”:选中间表中指向目标概念主键的字段 |
3. 保存配置
点击「确定并退出」完成关系映射。配置将立即生效,可用于后续结构化抽取任务。

编辑抽取任务
- 选择要编辑的任务:在任务列表中找到并点击要编辑的任务
- 点击「编辑」按钮:在任务操作菜单中点击「更多」后选择「编辑」
- 编辑任务信息:在弹窗中编辑任务的各项信息
- 点击「确定」按钮:完成任务的编辑

删除抽取任务
- 选择要删除的任务:在任务列表中找到并点击要删除的任务
- 点击「删除」按钮:在任务操作菜单中选择「删除」
- 确认删除:系统会弹出确认对话框,点击「确定」按钮

执行一次抽取任务
- 选择要执行的任务:在任务列表中找到并点击要执行的任务
- 点击「执行一次」按钮:系统会出现确认弹窗
- 确认执行:点击弹窗中的「确定」按钮开始执行任务

启用/停用定时更新
- 选择要操作的任务:在任务列表中找到并点击要操作的任务
- 点击滑动按钮:在任务操作菜单中选择「启用/停用」

查看抽取结果
- 选择要查看的任务:在任务列表中找到并点击要查看的任务
- 点击「抽取结果」按钮:在任务操作菜单中选择「抽取结果」
- 查看抽取结果:系统会显示抽取任务的执行结果

发布/取消发布
- 点击「发布/取消发布」按钮:在任务操作菜单中选择「发布/取消发布」
- 确认操作:系统会弹出确认对话框,点击「确定」按钮完成操作

查看实体信息
- 点击图谱中实体:在图谱中点击要查看信息的实体

常见问题
支持哪些类型的数据源?
系统支持多种类型的结构化数据源,qKnow-开源版目前只支持MySQL关系型数据库。
如何优化抽取性能?
为了优化抽取性能,建议:
- 避免多表联查进行抽取
- 对大数据量进行分页查询处理
抽取结果如何验证?
抽取完成后,系统会生成抽取报告,用户可以通过查看报告了解抽取的数据量、成功率等信息。同时,用户还可以查看抽取的具体数据,验证数据的准确性。
