基于多数据源融合的医疗知识图谱框架构建研究

来源:公文范文 发布时间:2022-12-13 13:10:03 点击:

摘 要:[目的/意义]随着大数据和人工智能时代的来临,基于数据驱动的医疗辅助决策以及医疗健康知识挖掘受到人们的极大关注。医疗知识图谱是医疗信息分析和知识服务的基础,在医疗人工智能和医疗信息检索中发挥着重要作用。[方法/过程]本文以医疗领域的实际应用需求为出发点,从医疗大数据获取、医疗实体及关系标注、医疗实体识别、医疗实体链接、医疗实体关系挖掘、中文医疗知识图谱表示和存储等关键技术入手,提出了多数据源融合的医疗知识图谱构建的理论框架。[结果/结论]面向医疗领域的知识图谱构建是一项非常重要的基础任务,同时也是人工智能领域的重要发展方向。

关键词:医疗知识图谱;多源数据融合;实体识别;实体链接;实体关系

DOI:10.3969/j.issn.1008-0821.2019.06.009

〔中图分类号〕G250.2 〔文献标识码〕A 〔文章编号〕1008-0821(2019)06-0081-10

Abstract:[Purpose/Significance]With the approaching of the big data and artificial intelligence age,people have been paying great attention to the medical-assisted decision making and mining for the medical health knowledge based on the data driving.As the basis of medical information analysis and medical knowledge services,medical health knowledge graphs play a significant role in the medical artificial intelligence and medical information retrieval.[Method/Process]Therefore,based on the actual application demand in medical field and proceeded with such key technologies as acquisition of medical big data,annotation of medical entities and their relations,identification of medical entities,linkage of medical entities,mining for relations of medical entities,as well as expression and storage of Chinese medical health knowledge graphs,this paper put forward a theoretical framework regarding construction of the medical health knowledge graph integrated with multi-data sources.[Result/Conclusion]The construction of knowledge maps for the medical field was a very important basic task,and it is also an important development direction in the field of artificial intelligence.

Key words:medical knowledge graph;multi-data source fusion;entity recognition;entity linking;entity relationship

隨着医疗信息化的迅猛发展,医疗机构以及各类互联网平台产生了大量的医疗数据,这些数据蕴含着丰富的医疗知识,经过处理和分析的医疗大数据不仅可以为医生的临床诊断提供辅助决策[1];还可以通过各种应用平台为公众提供高质量的医疗信息服务,提升公众的医疗信息素养。因此,如何深入挖掘并利用各类医疗大数据成为当前人们关注的热点。

近些年,受到自然语言理解和人工智能的推动,基于大数据的语义知识库自动构建受到了学界和业界的极大关注。2012年,Google提出了知识图谱的概念,此后国内外出现了面向各种应用的知识图谱。常见的如DBpedia[2]、Freebase[3]、Knowledge Vault[4]、NELL[5]、YAGO[6]等,这些知识图谱的数据主要来自维基百科。国内中文知识图谱主要有百度的“知心”、搜狗的“知立方”、SSCO[7]和Zhishi.me[8]等,这些通用知识图谱以各类非结构化或半结构化数据为来源,体量大,覆盖面广。但在面向专业领域的信息分析等需求时,通用知识图谱在实体粒度以及领域语义知识表征不够细化,尤其是对于专业要求非常高的医疗领域。因此,在医疗领域的信息分析和人工智能应用中,面向领域的知识图谱更有针对性。Ernst P等[9]基于科学文献、健康记录以及问答社区等多种网络数据源构建了健康和生命科学的英文知识图谱。此外,国外已经建成了医疗领域资源库一体化医学语言系统(UMLS)[10]、医学系统命名法—临床术语(SNOMED CT)知识库[11]等资源。在国内,由复旦大学等构建了面向细分领域的中文知识图谱OpenKG.cn。虽然国内出现了一些探索和尝试,但更多的还是处于探索阶段。陈德华[12]等提出了一种基于增量学习的临床领域时序知识图谱链接预测模型。Weng H等[13]基于临床病历,提出了自动构建中医知识图谱的研究框架。He B[14]等建立了一个包含句法和语义的中文电子病历语义知识库。阮彤等[15]、贾李蓉等[16]基于中医病症分类代码和中医药学语言系统,构建了中医药知识图谱。通过文献梳理可以发现,通用领域知识图谱已经比较成熟,但领域知识图谱更多的还处于探索中。和国外相比,国内医疗领域知识图谱才刚刚开始起步,亟需学界和业界齐心协力构建面向各类医疗需求的领域知识图谱,进而提升国内的医疗信息服务和人工智能水平。

推荐访问:图谱 框架 融合 构建 医疗
上一篇:无机材料物理化学课程教学实践与教学改革
下一篇:上肢康复机器人对脑卒中患者的疗效分析

Copyright @ 2009 - 2024 优泰范文网 All Rights Reserved

优泰范文网 版权所有 备案号:粤ICP备09201876号-1