一、文章主要内容总结
该研究聚焦于知识图谱中的实体链接(Entity Linking, EL)任务,核心是解决传统实体链接方法在长尾实体(稀有或多义实体)处理、域外语料适配等方面的不足。文章提出了一种基于大语言模型(LLM)的上下文增强策略与联合微调框架,具体内容如下:
- 任务背景:实体链接包含命名实体识别(NER)和实体消歧(ED)两个核心步骤,传统方法多采用两阶段分离模型,计算成本高且对歧义实体、域外语料处理效果不佳。
- 核心方法:
- 以T5模型为基础,联合微调NER和ED任务,构建统一框架,避免分离模型的性能损耗与资源浪费;
- 引入LLaMA3(70B参数)进行上下文增强,将模糊实体提及(如“Angelina”)扩展为明确形式(如“Angelina Jolie”),缩写(如“AK”)补全为全称(如“Alaska”),提升消歧准确性;
- 针对LLM幻觉问题,通过构建维基百科标题-URI字典、仅基于NER标注结果进行扩展等方式进行缓解。
- 实验设计:在AIDA-test-B、KORE50等8个基准数据集(含域内和域外数据)上开展实验,采用InKB微F1分数作为评价指标,对比传统两阶段模型、端到端模型等基线方法,并通过消融实验验证增强策略的有效性。
- 实验结果:该方法在多数域外语料集上达到当前最优性能,尤其在高歧义数据集(如KORE50)上F1分数显著提升;但在训练数据分布相似的域内数据集(如AIDA-te
订阅专栏 解锁全文
2948

被折叠的 条评论
为什么被折叠?



