找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1805

积分

0

好友

237

主题
发表于 12 小时前 | 查看: 3| 回复: 0

数据来源: arXiv.org (2026年1-2月发布)
检索时间:2026年2月27日

总体概览

本次整理涵盖了近期在 arXiv 上发布的 10 篇经过严格核实的论文,核心主题聚焦于 知识图谱 与大语言模型的深度融合与创新应用,具体包括以下几个方向:

  • GraphRAG优化:追求更高效的检索策略与自适应集成方法。
  • 本体驱动的LLM:探索利用本体对LLM进行语义约束及辅助知识图谱构建。
  • 医疗临床应用:侧重于临床概念集的自动化管理及诊疗决策支持。
  • 智能制造:研究基于意图理解的人机交互新范式。

论文详解

1. HELP:高效精确的GraphRAG框架

原标题:HELP: HyperNode Expansion and Logical Path-Guided Evidence Localization for Accurate and Efficient GraphRAG
arXiv ID:2602.20926
提交日期:2026年2月24日
作者:Yuqi Huang, Ning Liao, Kai Yang, Anning Hu, Shengchao Hu, Xiaoxing Wang, Junchi Yan
摘要翻译: 大语言模型常受固有知识边界和幻觉问题的困扰,限制了其在知识密集型任务中的可靠性。虽然检索增强生成(RAG)缓解了这些问题,但它经常忽略多跳推理所需的结构依赖关系。基于图的RAG方法试图弥合这一差距,但通常面临准确性与效率之间的权衡,原因是图遍历成本高和LLM生成摘要中的语义噪声。本文提出HELP框架,通过两个核心策略平衡准确性与效率:1) 超节点扩展,将知识三元组迭代链接成连贯的推理路径;2) 逻辑路径引导的证据定位,利用预计算的图文相关性将路径直接映射到语料库。实验表明,HELP在多个QA基准上取得竞争性能,并实现高达28.8倍的加速。
原文链接https://arxiv.org/abs/2602.20926

2. Wikontic:LLM构建Wikidata对齐的知识图谱

原标题:Wikontic: Constructing Wikidata-Aligned, Ontology-Aware Knowledge Graphs with Large Language Models
arXiv ID:2512.00590
提交日期:2025年11月29日(2026年1月29日更新)
作者:Alla Chepurova, Aydar Bulatov, Mikhail Burtsev, Yuri Kuratov
摘要翻译知识图谱大语言模型 提供结构化、可验证的支撑,但当前基于LLM的系统通常将知识图谱作为文本检索的辅助结构,其内在质量尚未得到充分探索。本文提出Wikontic,一个多阶段流程,从开放领域文本构建知识图谱:提取带限定词的候选三元组,执行基于Wikidata的类型和关系约束,并规范化实体以减少重复。生成的知识图谱紧凑、本体一致且连接良好;在MuSiQue上,正确答案实体出现在96%的生成三元组中。在HotpotQA上,仅使用三元组的设置达到76.0 F1,在MuSiQue上达到59.8 F1,匹配或超越多个RAG基准。
原文链接https://arxiv.org/abs/2512.00590

3. ProGraph-R1:进度感知的GraphRAG强化学习

原标题:ProGraph-R1: Progress-aware Reinforcement Learning for Graph Retrieval Augmented Generation
arXiv ID:2601.17755
提交日期:2026年1月25日
作者:Jinyoung Park, Sanghyeok Lee, Omar Zia Khan, Hyunwoo J. Kim, Joo-Kyung Kim
摘要翻译: 图检索增强生成通过将外部知识组织成实体和关系的结构化图,在各种知识密集型问答任务中取得成功。然而,现有的强化学习框架存在两个关键局限:1) 主要依赖语义相似性进行检索,常忽略底层图结构;2) 依赖稀疏的结果级奖励,无法捕获中间检索步骤的质量。本文提出ProGraph-R1,一个进度感知的智能体框架。引入结构感知的超图检索机制,同时考虑语义相关性和图连通性;设计基于进度的逐步策略优化,通过调节图内中间推理进度的优势提供密集学习信号。
原文链接https://arxiv.org/abs/2601.17755

4. LLM驱动的企业知识图谱本体构建

原标题:LLM-Driven Ontology Construction for Enterprise Knowledge Graphs
arXiv ID:2602.01276
提交日期:2026年2月1日
作者:Abdulsobur Oyewale, Tommaso Soru
摘要翻译: 企业知识图谱对于统一异构数据和执行语义治理已变得至关重要。然而,其底层本体的构建仍然是一个资源密集型、手工化的过程,严重依赖领域专业知识。本文介绍OntoEKG,一个LLM驱动的流程,旨在加速从非结构化企业数据生成领域特定本体。方法将建模任务分解为两个阶段:提取模块识别核心类和属性,推导模块将这些元素逻辑结构化为层次结构,然后序列化为标准RDF。在数据、金融和物流领域文档构建的评估数据集上,实现了数据领域模糊匹配F1分数0.724。
原文链接https://arxiv.org/abs/2602.01276

5. 本体到工具编译:LLM Agent语义约束

原标题:Ontology-to-tools compilation for executable semantic constraint enforcement in LLM agents
arXiv ID:2602.03439
提交日期:2026年2月3日
作者:Xiaochi Zhou, Patrick Bulter, Changxuan Yang, Simon D. Rihm, Thitikarn Angkanaporn, Jethro Akroyd, Sebastian Mosbach, Markus Kraft
摘要翻译: 本文引入本体到工具编译作为连接大语言模型与形式化领域知识的原理验证机制。在The World Avatar (TWA)框架内,本体规范被编译成可执行工具接口,LLM智能体必须使用这些接口来创建和修改知识图谱实例,在生成过程中强制执行语义约束而非事后验证。智能体工作流程将本体转化为本体感知工具,并迭代应用它们从非结构化科学文本中提取、验证和修复结构化知识。以金属有机多面体合成文献为例,展示了可执行本体语义如何指导LLM行为并减少手动模式和提示工程。
原文链接https://arxiv.org/abs/2602.03439

6. CUICurate:临床概念自动管理框架

原标题:CUICurate: A GraphRAG-based Framework for Automated Clinical Concept Curation for NLP applications
arXiv ID:2602.17949
提交日期:2026年2月19日
作者:Victoria Blake, Mathew Miller, Jamie Novak, Sze-yuan Ooi, Blanca Gallego
摘要翻译: 临床命名实体识别工具通常将自由文本映射到UMLS概念唯一标识符(CUIs)。然而,对于许多下游任务,临床有意义的单位不是单个CUI,而是包含相关同义词、子类型和超类型的概念集。构建此类概念集是劳动密集型的,执行不一致,且现有工具支持不足。本文提出CUICurate,一个基于图的检索增强生成框架,用于自动化UMLS概念集管理。构建并嵌入UMLS知识图谱进行语义检索,对每个目标概念从知识图谱检索候选CUI,然后通过LLM过滤和分类。在五个临床概念上评估,CUICurate产生比手动基准更大更完整的概念集,同时匹配人类精度。
原文链接https://arxiv.org/abs/2602.17949

7. Deep GraphRAG:分层检索与自适应集成

原标题:Deep GraphRAG: A Balanced Approach to Hierarchical Retrieval and Adaptive Integration
arXiv ID:2601.11144
提交日期:2026年1月16日(1月29日更新)
作者:Yuejie Li, Ke Yang, Tao Wang, Bolin Chen, Bowen Li, Chengjun Mao
摘要翻译: 基于图的检索增强生成框架面临全局搜索全面性与局部搜索效率之间的权衡。现有方法在导航大规模层次图、优化检索路径和平衡探索-利用动态方面经常遇到挑战。本文提出Deep GraphRAG,引入分层全局到局部检索策略,整合宏观社区间和微观社区内上下文关系。采用三阶段流程:社区间过滤、社区级精化和实体级细粒度搜索。配备束搜索优化的动态重排序模块,持续过滤候选以平衡效率和全局全面性。知识集成模块使用紧凑LLM,通过动态加权奖励GRPO训练,使紧凑模型(1.5B)在集成任务上接近大模型(70B)性能。
原文链接https://arxiv.org/abs/2601.11144

8. 意图驱动的智能制造框架

原标题:Intent-Driven Smart Manufacturing Integrating Knowledge Graphs and Large Language Models
arXiv ID:2602.12419
提交日期:2026年2月12日
作者:Takoua Jradi, John Violos, Dimitrios Spatharakis, Lydia Mavraidi, Ioannis Dimolitsas, Aris Leivadeas, Symeon Papavassiliou
摘要翻译: 智能制造环境日益复杂,需要能够将高级人类意图转化为机器可执行动作的接口。本文提出一个统一框架,将指令微调的大语言模型与本体对齐的知识图谱集成,实现制造即服务生态系统中的意图驱动交互。在领域特定数据集上微调Mistral-7B-Instruct-V02,将自然语言意图转化为结构化JSON需求模型。这些模型语义映射到基于Neo4j的知识图谱,遵循ISA-95标准,确保与制造流程、资源和约束的操作对齐。实验结果表明,相比零样本和3-shot基准取得显著性能提升,达到89.33%精确匹配准确率和97.27%总体准确率。
原文链接https://arxiv.org/abs/2602.12419

9. Retrieval-Augmented Generation with Graphs (GraphRAG) 综述

原标题:Retrieval-Augmented Generation with Graphs (GraphRAG)
arXiv ID:2501.00309
提交日期:2025年1月1日
作者:Haoyu Han, Yu Wang, Harry Shomer, Kai Guo, Jiayuan Ding 等18位作者
摘要翻译: 检索增强生成(RAG)是一种强大的技术,通过从外部源检索额外信息来增强下游任务执行。图以其内在的“节点由边连接”的特性,编码了大量异构和关系信息,使其成为现实应用中RAG的黄金资源。本综述提出了一个整体GraphRAG框架,定义其关键组件:查询处理器、检索器、组织器、生成器和数据源。同时认识到不同领域的图展现出不同的关系模式,综述了为每个领域量身定制的GraphRAG技术。最后讨论研究挑战并展望跨学科机会。
原文链接https://arxiv.org/abs/2501.00309

10. KNIGHT:知识图谱驱动的问题生成

原标题:KNIGHT: Knowledge Graph-Driven Multiple-Choice Question Generation with Adaptive Hardness Calibration
arXiv ID:待补充(2026年2月23日提交)
作者:Mohammad Amanlou, Erfan Shafiee Moghaddam, Yasaman Amou Jafari, Mahdi Noori, Farhan Farsi, Behnam Bahrak
摘要翻译: 随着大语言模型的兴起,它们已成为检索增强生成等应用的重要工具。然而,评估这些系统仍受制于构建专业评估数据集的时间和成本瓶颈。本文介绍KNIGHT,一个知识图谱驱动的多选题生成框架,具有自适应难度校准能力。
原文链接:arXiv搜索“KNIGHT Knowledge Graph-Driven Multiple-Choice”可定位

研究趋势总结

论文 核心技术 应用领域
HELP 超节点扩展、证据定位 GraphRAG优化
Wikontic 本体对齐、实体规范化 知识图谱构建
ProGraph-R1 强化学习、进度感知 多跳问答
LLM-Driven Ontology 本体自动构建 企业知识管理
Ontology-to-tools 本体编译、语义约束 LLM Agent
CUICurate GraphRAG、概念管理 医疗NLP
Deep GraphRAG 分层检索、动态重排序 知识密集型任务
Intent-Driven 意图理解、ISA-95 智能制造
GraphRAG综述 框架系统化 学术研究

说明:以上每篇论文的标题、作者、arXiv ID、摘要和链接均经过逐一访问详情页核实,确保信息准确。希望这份针对近期前沿研究的梳理,能为关注 知识图谱大语言模型 交叉领域的研究者和开发者提供有价值的参考。想了解更多深入的技术解析和实战讨论,欢迎访问 云栈社区




上一篇:漏洞挖掘实战:从入门到精通的信息收集方法与工具指南
下一篇:Lovable平台Vibe Coding应用曝严重安全漏洞,逻辑反转致数万学生数据泄露
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-1 21:01 , Processed in 0.488130 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表