卫生信息化与创新数据技术
【摘要】卫生信息化包括很多系统,它们的整体性取决于基础数据的通用性,数据的通用性取决于内在的逻辑性,尤其是与核心医疗业务相关的部分。目前卫生信息化已形成三类垂直结构,对医疗数据都只能进行浅层的个案查阅,不能进行深层的统计调用。本文提出建立以新型病历编辑器为核心的临床通用终端,用编辑器解决病历撰写与医疗内容的提取问题,用知识库解决数据规范与逻辑基础问题。通过创建一种新的数据结构,解决众多以往只能基于复杂统计算法才能解决的问题,使卫生信息化的发展进入高级阶段。
【关键词】区域卫生信息化,统计结构,医疗键词,医学逻辑,公共卫生,医学人工智能
1.引导概念
卫生的业务核心是医疗和民众,其它各类业务从与核心相关的经济及管理目标中衍生出来。信息化方向下医疗与卫生两者的差别在于:医疗信息化由一线医疗业务定义,处于基层,关注病员个体,目标是医院和医疗机构信息化,产生基础数据;卫生信息化从公共卫生业务定义,处于高层,关注社会群体,目标是国家和区域卫生信息化,利用基础数据;沟通这两者的中心线索是医疗实质内容,如症状、病史、体征、诊断等。本文提出的“医疗键词”是医疗实质内容表达的通用词汇,同时承担数据结构中关键词的角色。用键词技术组构卫生信息化的基础数据是本文的核心思想。
2.技术不足导致信息化的垂直结构
卫生信息化的实际起始时间晚于医院信息化。2003年非典时期,卫生主管机构面对突发非典疫情,深感信息不通、指挥不灵带来的切肤之痛,成为日后推行卫生信息化的最大动因。彼时,人们企盼信息化能追踪疫情变化、了解疫情的统计性规律、获取切实的医疗资讯帮助等。非典之后的几年,政府虽花费巨资解决卫生信息化问题,最后却未能完全实现非典期间的那种企盼,原因是技术难度太高。
笔者分析卫生信息化成果,归纳出以下三种垂直结构,并讨论相关问题:
①.国家卫生信息化:已经实现了传染病和突发公共卫生事件监测、突发公共卫生事件应急指挥与决策等重大项目。项目能够以“个案、实时、在线”[1]方式对传染病和突发公共卫生事件的信息进行处理,辨别事件严重程度,启动后续功能。这一切基于疫情和疾病流行状况数据,数据来源于网络直报。从基层直达顶层的CDC网络直报系统是一个垂直的独立结构[2]。直报系统虽然健全完备,其中仍藏有两个问题:一是没有与基层医疗机构数据系统发生直接联动关系,限制了系统的响应时间和范围;二是数据需填报上传,留下了手工操作可能产生的隐患,如漏报、误报、滞后等。
②.区域卫生信息化:要实现“预防保健、医疗服务和卫生管理一体化”[3]的基础,是医疗数据资源共享;仅当数据共享,其它信息化方向如:电子政务、社区服务、医保互通、双向转诊、网络教育、健康咨询等业务操作才有所依凭。医疗数据产生于各医疗机构,要使医疗数据支持区域公共卫生目标,若不能抽取医疗内容点进行把握,各种信息系统之间的数据传递与功能整合需要额外花费巨大人力资源,并且成效甚少。目前区域资源的共享办法只能是把电子病历直接放到共享服务器上,用姓名之类的外在句柄查找在线病历,最后取得简单的个案数据。
③.医疗机构信息化:疾病个案及相关信息均发生在医疗机构,表现医疗内容的实质信息均汇集于电子病历。电子病历是文本状态,医疗信息混合在自由文本中,很难被规范抽取,也就不能被区域公共卫生的目标切实利用。文本状态的电子病历会产生两个问题:一是假如出现某病情吻合疾病监控的上报条件,操作程序上必须另外有人甄别,再进入网络直报系统;这并不理想。理想的情况应该是一旦出现被监控信息,终端立即自动直接上报。二是研究疾病基于大量个案数据,如果信息化提不出可供分析的实质内容点,那么深层的统计调用就建立不起来,卫生信息化的巨大优势也显现不出来。
综合上述问题,下面拟通过新技术概念,破除区域卫生与医疗机构之间的数据壁垒。
3.数据可用性是卫生信息化的基本问题
国家卫生信息系统主要围绕公共卫生事件,拥有自己独立的数据来源,已经形成完整的一条龙体系。区域卫生信息化的目标不能被网络直报数据完全满足,必须另外建立自身的基础数据来源。2009新医改文件[4]为卫生信息化列出的一线目标是:疾病控制网络,预警与分析能力,居民健康档案,医院电子病历等;列出的技术要求是:互联互通、统一共享的网络平台,标准化与资源整合能力,信息系统对接,远程医疗等。该目标通过“人人享有”、“纵向到底、横向到边”[5]的憧憬展示出具象图景:所辖区内民众一辈子生命体征、精神状况、健康记录、诊疗病史、家族病史等全部数据的整合。假如历经数年,浩繁数据只能沉积下来,待到临时为某目的再启数据挖掘,那么投效率就太低,直接影响新医改的整体成果。
问题是怎样建立有用的数据源?笔者认为:高层卫生目标与基层医疗数据必须相互联系,如果从技术上把它们之间的数据吞吐能对接起来,那么区域卫生信息化就成了有源之水、有本之木。从医院、社区医疗到个体诊所,乃至健康体检等,凡由医生执行的诊疗过程必然产生临床数据,表现为电子病历或健康档案。这些数据汇集起来就是汪洋大海;公共卫生目标:监控疫情、追踪疾病发展、提高全民健康水平等,都必须面对这一片数据海洋。医疗信息化的低级结果是产生一片数据海洋,卫生信息化的高层目标是把这一片数据海洋变成卫生资源,其关键是数据的可用性。
产生并保存医疗数据的电子病历,目前只有个案性的文本数据,如下图一,是一般医生工作站经由模版产生电子病历的流程:(图略)
病历记录的成型主要源自于对某个特定文字性模版的修改。模版是医生或科室范围内认可的一段关于某个疾病的文字描述。现行模版分为两种:①自由文本模版,可溯源到“电子文本记录法”[6],特点是自由书写,或将某病历记录保留为模版形式,供下次调用。②结构化模版,来源于格式化病历加“结构化记录法”,特点是设定描述的过程要素,再通过对某些医疗特征的菜单式选择,形成病历。无论哪种形式,最后的电子病历都是文本格式,医疗内容点被固着在文本之中,除了通过外在句柄逐篇查阅个案外,不能通过医疗内容展开深层的统计性调用。不能用就是死数据,死数据无法给区域卫生信息化创造资源的共享条件。
4.基于通用终端的技术解决方案
本文要解决的核心问题,是基础医疗数据的可用性问题。首先,我们创造一个新概念医疗键词。前面提到:医疗键词既包含医学实质内容,又起数据结构作用,此外,它还与知识库联系,起规范作用,身兼三职。医疗键词突破信息化医疗数据的可用性问题,只是概念上的第一步。创建一个新的病历编辑器,实现从病历撰写过程提取医疗键词,帮助医生以自然状态完成病历,这是医生信息交互操作的第一步,同时合并了医疗键词产生的第一步。所有不同级别医疗机构面对的患者是共同的,卫生行政管理部门对医生看病的规定也有一致性,病历编辑器不难具有共性,但要普遍适合于不同层级的医院、不同目标的医疗机构、不同专科的医生等,就要创建一种核心一致、规范相同,能够伸缩功能、加减专科的临床通用终端,这是区域卫生信息化的第一步。
再梳理前面三个第一步:①为区域卫生信息化创建一种适用于不同层级和不同科室的通用终端;②为通用终端嵌入一个能够提取规范医疗键词的病历编辑器;③为医疗键词建立一种关联电子病历的新数据结构,作为区域卫生信息化各种功能目标的数据基础。
用“通用终端”承担解决数据统一问题的工程性角色,还必须包含如下内容:
1) 在设定的一个从医疗基层到卫生高层的信息化一揽子计划中,至少有三种数据结构:一是知识库结构,包含医学词汇的规范、词义间的相互定义,并由此形成的医学逻辑基础。二是病历结构,保存全部的病人信息和临床记录内容。三是统计结构,以医疗键词统析全部病历个案,键词与知识库中规范词汇对等关联。
2) 与通用终端相关的三种数据结构及其关系,必须具有对外开放的可成长性。
3) 三种数据结构关联到三种庞大体系,体系间的复杂关系会导致系统的把握难度增加,通用终端必须通过知识库降低认知难度,并利用人工智能技术加强把握能力。
4) 医生、患者与疾病,三者都是个性化的存在。通用终端要能够用医疗键词仿真临床思维,把握疾病特点,描述患者的个性化差异。并且通用终端要能够适应地方性语言特点,用同义规范地域差异的医学共性,扩大地域适应范围等。
5.基于病历编辑器的键词技术
上面是医疗键词抽取和数据一致性的一般原则,实际具体的技术性问题一定是存在于电子病历的书写过程。在病历书写的同时提取医疗键词的医学意义和技术过程是否合理呢?
病历书写是医疗信息化的第一门槛,因为直接键盘输入增加医生工作强度,所以多被搁置不用,代之以模版编辑法。无论是键盘输入还是模版编辑,得到的结果都是按卫生部规定格式记录的文本病历;之后,医生看起来是像依据完整病历给出诊断。实际上医生判断的依据不是全部记录,而是医生个人认为有意义的部分。参见下图二。(图略)
根据临床实际情况,新型病历编辑器不再只做文本书写,要同时从文本中分离出医疗键词。这样,通用终端所形成的病历看起来仍是文本病历,实际上已经是两个部分组成:一是自由文本,主要辅助病情记录,不参与判断;二是医疗键词,属诊疗依据,参与判断。同理,在此基础上可实现新模版技术:把疾病的医疗键词全部预置在模版中,拖拽分配到主诉、病史、查体、检验等设定位置,形成模版框架,再在需要的地方插入自由文本,形成新疾病模版。
通用终端的病历编辑器技术比较复杂,因为它同时要解决:①自由文本输入问题,②医疗键词输入问题,③病历中两种对象的存储问题,④医疗键词抽取问题,⑤医疗键词的统计结构问题。另外,编辑器要符合一般编辑习惯和输入习惯,操作界面要符合医生专业习惯,看起来要像一张病历纸等。以下图三表现编辑器、病历纸、知识库的关系,其中病历纸上的灰线条表示自由文本,粗红线段表示医疗键词。应用时,两部分颜色显示也不同,一眼能看出哪些词汇起判断依据作用。(图略)
通用终端的智能辅助功能是基于全医学知识库决策引擎实现[7],系统全局提示医疗键词的相关关系,例如:输入一个诊断病名,则系统自动从症状、病史、体征等方面比较该诊断的准确性,帮助医生拓宽思路,防止误诊漏诊。若修改病历中的医疗键词,系统可以启动辅助提示,诊断结果的提示可能会因此发生变化,这也顺应了病历的逻辑和医学意义。同时系统并不干扰医生撰写病历,智能提示要能够轻松关闭。
区域卫生信息化的基础数据主要来源于电子病历,通用终端将病历中的临床内容自动抽出,形成一种新的以医疗键词为纲目的统计结构。这种结构为区域卫生信息化提供的基础数据可以满足区域公共卫生的绝大部分业务目标要求,包括医疗、研究、统计、管理等。
6.结语
上一节显示数据和技术的重点交汇在通用终端的编辑器上,但本文的主要目标并不在于如何撰写病历,而是在于如何通过撰写病历获得一个新的支持区域卫生信息化的数据结构。宏观的卫生信息化必须有规范的微观医疗信息化为其提供数据基础。进一步,通用终端的全医学知识库和决策引擎技术,不仅产生符合医理的个案病历数据,而且从医学逻辑为卫生信息化提供广泛关联的基础;大范围疾病趋势研究和公共卫生数据共享都少不了这种逻辑基础。显然,唯其具备了上述数据、技术和逻辑基础,区域卫生信息化才会步入高一层发展阶段。
(2009.6.20.完稿)
参考文献:
7) 李科威:《医学人工智能与生态动力学问题》,中国数字医学,2008.04.
李科威 博士
地址:深圳市百花一路国城花园1-6F
邮编:518028
电话:13798456585