这是中科院软件所刘焕勇老师在github上的一个开源项目
地址:http:// https://github.com/liuhuanyong/QASystemOnMedicalKG
本项目构建了以疾病为中心的医疗知识图谱,实体规模4.4万,实体关系规模30万。并基于此,搭建起了一个可以回答18类问题的自动问答小系统。
本项目以neo4j作为存储,并基于传统规则的方式完成了知识问答,并最终以cypher查询语句作为问答搜索sql,支持了问答服务。
基于知识图谱的问答框架
基于知识图谱的问答系统应用知识
- 本体构建
- RDF 生成
- 问句解析
- SPARQL 查询
- 答案生成
本项目的问答系统完全基于规则匹配实现,根据问句中的关键词进行匹配,对匹配到的关键词分类问句,然后使用cypher的match去匹配查找neo4j,根据返回数据组装问句回答,最后返回结果。
医药领域知识图谱规模
知识图谱实体类型
| 实体类型 | 中文含义 | 实体数量 | 举例 |
|---|---|---|---|
| Check | 诊断检查项目 | 3,353 | 支气管造影;关节镜检查 |
| Department | 医疗科目 | 54 | 整形美容科;烧伤科 |
| Disease | 疾病 | 8,807 | 血栓闭塞性脉管炎;胸降主动脉动脉瘤 |
| Drug | 药品 | 3,828 | 京万红痔疮膏;布林佐胺滴眼液 |
| Food | 食物 | 4,870 | 番茄冲菜牛肉丸汤;竹笋炖羊肉 |
| Producer | 在售药品 | 17,201 | 通药制药青霉素V钾片;青阳醋酸地塞米松片 |
| Symptom | 疾病症状 | 5,998 | 乳腺组织肥厚;脑实质深部出血 |

该博客介绍了中科院软件所刘焕勇老师的开源项目,该项目构建了一个包含4.4万实体和30万关系的医疗知识图谱,用于支持18类问题的自动问答。知识图谱基于Neo4j存储,问答系统通过规则匹配实现,涉及疾病、症状、药品、检查等多个方面。此外,还提供了项目运行配置、数据导入和问答启动的步骤。
2117

被折叠的 条评论
为什么被折叠?



