非结构化抽取 - qKnow 开源版
2026/3/18大约 4 分钟用户手册
功能概览
非结构化抽取模块是 qKnow 开源版中用于从非结构化数据中提取知识的核心功能,为用户提供从知识中心文件中提取实体、关系和属性信息的能力。
主要特性
- 📄 知识中心文件支持:支持从知识中心上传的文本、PDF、Word 等多种非结构化文档中提取数据
- 🤖 智能识别:采用先进的自然语言处理(NLP)技术,自动识别并提取其中的实体、事件和关系信息
- 🔗 三元组提取:支持提取实体之间的关系,形成结构化的三元组数据
- 📋 抽取任务管理:支持创建、编辑、删除抽取任务,实时监控任务执行状态
- 📊 执行日志:记录任务执行过程和结果,便于用户查看和分析
操作指南
非结构化抽取页面
点击【知识抽取】→【非结构化抽取】,进入非结构化抽取页面。该页面展示所有已配置的抽取任务,支持任务的新增、编辑、删除、执行和查看执行日志等操作。

新增抽取任务
- 点击「新增」按钮:页面会出现「添加非结构化抽取任务」弹窗
- 填写任务信息:
任务名称:输入抽取任务的名称(必填,*标记为必填项)源文件:点击「导入知识中心文件」按钮,从知识中心选择要抽取的文件(必填,*标记为必填项)三元组:点击「导入三元组」按钮,从关系配置选择要提取的实体和关系(必填,*标记为必填项) - 点击「确定」按钮:完成抽取任务的新增

编辑抽取任务
- 选择要编辑的任务:在任务列表中找到并点击要编辑的任务
- 点击「编辑」按钮:在任务操作菜单中点击「更多」后选择「编辑」
- 修改任务信息:在弹窗中修改任务的各项信息
- 点击「确定」按钮:完成任务的编辑

删除抽取任务
- 选择要删除的任务:在任务列表中找到并点击要删除的任务
- 点击「删除」按钮:在任务操作菜单中点击「更多」后选择「删除」
- 确认删除:系统会弹出确认对话框,点击「确定」按钮

执行抽取任务
- 选择要执行的任务:在任务列表中找到并点击要执行的任务
- 点击「执行」按钮:系统会开始执行抽取任务

查看抽取结果
- 选择要查看结果的任务:在任务列表中找到并点击要查看结果的任务
- 点击「抽取结果」按钮:系统会显示该任务的抽取结果
查看执行日志
- 选择要查看的任务:在任务列表中找到并点击要查看的任务
- 点击「执行日志」按钮:系统会显示该任务的执行日志
- 查看详情:点击日志中的「详情」按钮,查看具体的执行详情

常见问题
支持哪些类型的非结构化数据源?
系统支持从知识中心上传的多种类型的非结构化数据源,包括文本文件(.txt)、PDF 文档(.pdf)、Word 文档(.docx)等。
抽取任务执行失败怎么办?
如果抽取任务执行失败,可以查看任务的执行日志,了解失败原因。常见的失败原因包括文件过大导致抽取时间过长从而导致抽取任务宕机、文档内容不支持抽取(如:图片、链接)等
如何提高抽取准确性?
为了提高抽取准确性,建议:
- 针对特定领域的文本,配置专门的三元组
- 对抽取结果进行人工验证和修正,不断优化三元组配置
- 结合领域知识,调整实体识别和关系抽取的参数
- 对复杂文档进行预处理,如分段、分句等
