您的当前位置:首页正文

基于本体的中医医案知识服务与共享系统构建研究

来源:个人技术集锦
基于本体的中医医案知识服务与共享系统构建研究 于琦①李敬华 李宗友①王映辉①孙晓峰①于彤①高宏杰①田野①徐丽丽① 摘要 目的:探讨中医医案信息的信息获取与管理方法。方法:从中医医案入手,以本体论为基础,采用语义网及自然 语言处理方法,实现中医医案信息的获取与组织管理。结果:在中医医案本体框架下构建中医医案术语体系,通过实体识 别和本体映射的方式,从医案中获取诊疗信息,存储成为结构化数据库,并可实现医案的统一管理、检索和挖掘利用。结 论:研究探索了基于本体的中医医案信息获取方法,构建了“中医医案知识服务与共享系统”,实现了中医医案的信息抽 取、数据库自动构建、管理和挖掘利用。 关键词本体中医医案信息获取数据库 Doi:lO.3969/j.issn.1673—7571.2017.05.034 【中图分类号】R2—0;R319 【文献标识码】A Research on Medical Record Knowledge Service and Sharing System of Traditional Chinese Medicine Based on Ontology/YU Qi. LI Jing—hua,LI Zong—you,et al//China Digital Medicine.一2(117 12(5):1()3 to 105 Abstract Objective:To explore information acquisition and management methods of information of medical records of traditional Chinese medicine.Methods:Starting from medical records of traditional Chinese medicine,on the basis of ontology,with semantic net and natural language processing methods,acquisition and organizational management of information of medical records of traditional Chinese medicine are realized.Results:The term system of medical records of traditional Chinese medicine is built under the rfamework of ontology system of medical records of traditional Chinese medicine.Through entity recognition and ontology mapping, diagnosis and treatnaent information is obtained from medical records,and stored in the structured database.The uniifed management, retrieval,mining and using of medical records can be realized.Conclusion:Information acquisition methods of medical records of traditional Chinese medicine based on ontology are studied and explored,the knowledge service and sharing system of medical records of traditional Chinese medicine is built,and information extraction,automatic database building,management,mining and using of medica1 records of traditional Chinese medicine are realized Keywords Ontology,medical records of Traditional Chinese Medicine,information acquisition,database Fund project Independent Subject Project of China Academy of Chinese Medical Sciences—Research on Knowledge Acquisition Methods of Proven Cases of Famous and Old Traditional Chinese Medicine Doctors Based on Ontology(No.zz()80312);National Natural Fund Project—Research OI1 Medical Record Similarity Calculation Model and Auxiliary Clinical Application(No.81001560) Corresponding author Institute of Information on Traditional Chinese Medicine,China Academy of Chinese Medical Sciences, Beijing 100700,P.R.C. 中医医案的整理、分析、挖掘规律、总结经验,是中医学术经验传承的重要方式,其中采集获取是分析利用的基础。 随着信息技术的发展和信息量的激增,快速;隹确的获取信息是信息利用的重要手段。知识获取是人工智能和知识工程领域 的核心技术…,是知识管理的基础 。知识获取的基本任务包括知识抽取、转换、输入、检测 。随着信息技术的发展和人 工智能领域的进步,多种算法应用于知识获取的方法研究中。包括基于决策树的知识获取方法 ,从本体论实现交互式半 夏基金项目:中国中医科学院自主选题项目一基于本体的名老中医临床验案知识获取方法研究(编号:zz080312);国家自然基金项目一医 案相似性计算模型及辅助临床应用研究(编号:81001560) 女通讯作者:中国中医科学院中医药信息研究所,100700,北京市东直门内南小街16号 ①中国中医科学院中医药信息研究所,1007{)0,北京市东直门内南小街16号 誊 ≥ 1 03 自动获取方法等 。 本研究通过本体的知识表示方法 和语义网技术,对中 医案进行语义 描述,在本体框架下构建术语词典可 对中医 案中的信息进行识别和采集 获取,形成结构化或半结构化的医案 存储与管理利用。 r——下——1———r 、 』 | f1 、 [ 1 I1 c t lt 0 j l 通过分析中 乏■暑 案的内容和结 构,设计中医医案本体的顶层分类和 相互关系。中医医案中主要包括基本 信息和诊疗信息两大主要部分。 医案的基本信息可包含患者信 息、医生信息和来源信息。其中患者 信息是患者留下的就诊时的相关信 息,可包括患者姓名、性别、年龄、 表]术l 果,晾, 捉 辑称 r},医疾捐 隈疾病 参芍采瓣 《 I 1 临l1、1 r术l扎II4求# 佳(} IcDIO “生自术”,则判定该词句为中药。 舒}》 如示例医案经过分句和实体识别后, 结果如表3所示。 表3中夏爱辜簧休。R i Jtt,是示例 【fJ蕞证候 l瘟 状律征 治法 l_ l {、 {J 忙I川q客 诬…ftl l 《r}】 药脑眯术语系统》 ・ I l禾i ’J。忙InIq家} 廿l 诊次等信息。医生信息是看诊医生的 相关信息,来源信息是医案的来源, 宵蒯 中成药 《中嚷方l荆火辞!蜒》 《- 曲J 实体类 姓名 ・ 实倒 弱 巾药 《瓶药药韶走令》 ,…q一}一曲敬 、《 0tt 2010眦 》 性别 年龄 男性 60 如临床医案、古籍 案等。医案的诊 诊次 初诊 疗信息是与临床诊疗过程相关的信 本文档分为短句,并按顺序标识位 息,可主要包括疾病病因、症状和体 置。如中医医案原文郑 ,男性, 就跨时间1990年9月5口 临床表现腹胀S纳少s乏力 舌暖 舌臻溃红s苔薄 征、疾病诊断、辨证分型、治则治 60岁,门诊号501 27,1 990—9—5初 脉象 脉细 浩批温肾畦脾s利水解毒注 法、处方用药等信息。研究初步设计 诊。主诉 腹胀,纳少,乏力,舌质 中医医案本体框架如图1所示。 淡红苔薄,脉细。治拟温肾健脾, 利水解毒法。药用 党参1 2g、生白 . 治法 中药 党参l2gs生自术l5窟s猪茯苓各20gs太鹱皮l5 ……鸡内金12g :I¨ 一 | 、 l_ ;’ t 术1 5g、猪茯苓各20g、大腹皮1 5g、 3.3本体映射实体识别后的中医医案 中医医案的描述中包含着大量的 八月 ̄L24g、土茯苓30g…鸡内金 数据已归于不同的实体类中,按照本 体的语义关系,将实例映射到名老中 术语概念,包括诊疗术语和专业概念以 及部分自然语言,建设合理的中医医案 术语体系是丰富中医 案本体实例和进 行医案知识获取的关键问题。研究以中 1 2g。 分句结果如表2所示。 表2中睡 寨分句孙 示例 医陕案本体中。通过本体的类别、属 性为医案实例赋予不同的类别和语义 生诉 牝9l、 . 机 ff挝, , 刊 舶 关系。示例 案文本通过本体映射, 将姓名、性别、年龄、诊次等信息映 射到患者基本信息类中;将纳少、乏 医案为研究对象,参考词表、标准、 昧细 工具书对通过相关术语概念的整理、去 3.2实体识别基于研究构建的名老中 重、规范等,建立面向名老中医医案的 医案本体,对中医 案文本分句后 力、苔薄、脉细等映射到症状体征类 术语集合。主要术语来源见表1。 的实体进行识别,并匹配到相应的实 中。将症;犬体征与患者基本信息类建 l体类中。例如定位于医案文本中间, 立“HAS症状体征IS”关系,从而将 j:■ 一 包含临床表现的实例,如“腹胀”, 则判定该词句为临床表现。定位于 患者基本信息中的实例与症状体征中 实例建立了语义关系。通过语义网络 … 一 3.1分旬以标点符号识别,将整篇文 案文本中间,包含中药的实例,如 联结中医医案知识,实现中医医案的 1 04 知识分类和知识表达,从而形成名老 中医医案知识库。 3.4知识获取知识获取通过分句、实 堕囹 !文本医塞: 识库构建,支持医案数 蛋暑 匦 ~叫据的集中存储、系统管 1名老中医医寨本体l 、 体识别和本体映射后,- D enlJ并抽取实 体内 案信息和规范医案信息。借助 本体对词的属性和类别进行判定后, 再进行字符串的匹配。同时,后期人 医寮信息分折功麓 ] 垂 理和挖掘利用。通过系 统的辅助信息抽取、术 语规范和挖掘算法的智 匣匣匣 能府用,能够有效提高 名医经验传承的质量和 工干预也必不可少。通过术语规范可 以规范医案语言,同时丰富术语词 汇,提高下一步知识获取的 隹确性。 3.4.1术语抽取在实体类下进行医案 信息的术语识别和拆分,进一步结构 化 案文本。如在实体临床表现中有 “发热恶寒,咳嗽气喘”两个词句, 通过术语的进一步抽取,则抽取为 “发热”、 “恶寒”、 “咳嗽”、 “气喘”四个术语词。 3.4.2术语规范基于术语词典将医案 数据进行规范,将不规范的语言表述 为较为规范的 案术语。如j -93“自觉 神疲乏力”规范为“神疲乏力”; 将“猪茯苓各20g”,规范为“猪苓 2O g¨和“茯苓20g”。如中医证候 “风湿入表”、 “表湿证”、 “湿郁 卫表证”,通过识别含有“湿”与部 位“表”的关系,将其规范为术语 “风湿袭表证”。 ( ● r 。 。 。尊 i≥ 一 董 I蠢l ;≤ : :1。 冀 丢 ≥j, 蕾栩薹 “中医医案知识服务与共享系 统” ,具有医案信息的集中存储,管 理,标;隹化处理 数据挖掘分析,医 案数据共享和医案查询等功能,为临 床医生、科研学者、高校师生等提供 案信息的管理、共享与利用服务。 系统应用基于本体的中医医案知识获 取方法,实现了中医医案结构化数据 库的自动构建及术语智能规范及分析 挖掘功能。 垂 壁圃匝塑 效率。 图 中 鲁陕案王¨识服务与共享系统信息抽取运 榉 系统在本体论的指 4.1系统功能运行流程具体见图2。 导下构建,可相对方便地接八机器学 4.2系统功能模块 习和人工智能等先进的技术方法,提 4.2.1医案采集可批量导入excel、txt等 高系统的智能性。中医药的传承是开 格式的 案文本和半结构化录入医案。 放性与局限性并存的,在保护知识产 4_2.2医案信息抽取通过基于本体的中 权的情况下实现经验的交流与共享是目 医医案知识获取方法,自动构建医案 前亟待解决的矛盾问题,系统通过建立 知识库存储。 工作组功能为解决该问题探索了方法。 4_2.3医案信息规范通过后台术语词典 同时,在互联网技术日益成熟和移动 自动规范为相应的术语并支持人工干 终端业务广泛廊用的大环境下,知识服 预调整。 务网站、移动App及微信公众账号等多 4.2.4医案信息分析挖掘对规范后的 种服务方式将可应用于医案系统的应用 案信息进行分析和挖掘功能,包括用 中。9 药规律、核心处方、药证关系、病症 关系等经验的挖掘。 / 献 4_2。5医案查询医案数据中心存储了约 l I 1(;}1 a II】IjcydOtlI1,A hiIl1 H(m 11 l1】l】 20万条名医医案、古今医案,供用户 A【 L1llisition of Search Kno\ ̄ledge_J1_Lecture 进行检索、查询和阅读。 Notes iI]Computer Srie ̄lcc,l‘ 7,1 3lq(j()): 4_2。6工作组功能支持名医工作室协同 68--85 工作,围绕名老中 的多个传承人可 I I曹存根.面向专家的知识获取lMl北京科 在不同时间不同地点进行医案采集, 学出版社,1998 集中汇总并学习讨论。 王永庆人工智能原理与方法【M】西安:西 安交通大学出版社, 、。 。 l4l张晶基q- ̄k:策树的知识获取方法研究L1] 在名医经验学习传承和临床经验 制造业自动化 !【】1 1.33(4):1 54—1 56 总结的过程中,临床医案的原始资料 【51用肖彬医学拳体和医学知识获取的研究 保存,统一系统管理是学术继承的基 f1)l北京中国科学院计算技术研究所 !【lfJ3 础,医案信息挖掘是学术思想总结的 于琦、王映辉,李敬华tP医名医医案分析系 重要支撑。通过建立中医医案本体, 统研究_Jl_中国数字医学. …5,…(j):j卜53 探索了中医医案知识获取方法,并在 【J 稿日期: 【】In 1I I 5】 “中医医案知识服务与共享系统”中 【f9日期::II1 7(11一o5】 实现了医案文本信息的自动抽取和知 (责任编辑:刘华) 1 05 

因篇幅问题不能全部显示,请点此查看更多更全内容