2025_NIPS_KGGen: Extracting Knowledge Graphs from Plain Text with Language Models

最新推荐文章于 2026-06-30 20:33:07 发布

原创最新推荐文章于 2026-06-30 20:33:07 发布 · 37 阅读

·

0

·

标签

#知识图谱 #语言模型 #人工智能

LLM Daily 同时被 3 个专栏收录

2903 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

Knowledge Graph

90 篇文章 ¥99.90 ¥299.90

订阅专栏

919 篇文章

订阅专栏

文章主要内容与创新点总结

一、主要内容

该研究针对知识图谱（KG）数据稀缺、现有自动提取工具质量不足的问题，提出了一款名为KGGen的文本到知识图谱生成工具，同时构建了首个专门评估文本到知识图谱提取效果的基准测试集MINE。

背景：现有知识图谱（如Wikidata、DBpedia）存在完整性不足的问题，而OpenIE、GraphRAG等主流提取工具缺乏有效的实体消歧和关系规范化机制，导致生成的图谱稀疏、关联性差，难以支撑下游任务（如KG嵌入、图谱RAG）。
KGGen核心流程：
- 实体与关系提取：基于语言模型（如Gemini 2.0 Flash）和DSPy签名，分两步提取主谓宾三元组，确保实体一致性；
- 聚合：收集所有源文本的实体和边，标准化为小写以减少冗余；
- 实体与边消歧：结合S-BERT嵌入聚类、BM25语义检索和LLM去重，合并同义实体和等价关系，生成简洁通用的图谱。
评估基准MINE：包含两个任务——MINE-1（评估短文本信息保留率）和MINE-2（评估大规模文本的RAG性能），同时在SemEval-2010人工标注数据集上验证实体提取准确性。
实验结果：
- KGGen在MINE-1上平均得分66.07%，显著优于GraphRAG（47.80%）和OpenIE（29.84%）；
- MINE

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。