互联网医疗(六):大数据如何开启千亿级市场?

北大医信也在与北京大学合作,研究临床医疗大数据的分析和利用。北大医信服务过的医院超过500家,其中三甲医院200多家,占全国三甲医院总数的1/4左右,北京大学下属有9家附属医院、13家教学医院,这些医院信息系统中积累的大量数据,为进行大数据分析和利用打下了坚实的基础。

北大医信资深副总裁兼CTO邹悦告诉网易科技,目前北大医信的临床决策支持体系正在北京大学人民医院、北京大学国际医院、江苏省人民医院进行试点。

北大医信已经开发了临床预警和建议类的应用。预警类的应用可以根据患者的一些生命体征,判断患病风险并进行提示。建议类的应用,目前北大医信做了糖尿病这个病种,系统可以根据糖尿病人的症状、检验检查结果和病历,给出相应的治疗方案建议。

在临床科研方面,北大医信也做了一些数据分析,并且得到了一些结果。比如,以往子宫内膜异位和子宫肌瘤的误诊率高达65.1%,因为两种疾病的症状非常相似。通过大数据分析发现,卵巢囊肿、腹痛、贫血这三种症状在这两种病中的权重是不同的,子宫内膜异位与卵巢囊肿的关联最强,子宫肌瘤和贫血的关联最强。

“我们分析出了这个结果,但是在临床上怎么用,还要再进一步探讨。”邹悦介绍。

好医生集团董事长高瞻认为,要让大数据产生价值,需要有一条完整的价值链,目前中国的这个价值链还有缺失。大数据的价值链有数据的收集、储存、分析、应用四个环节,但是目前这个产业投入比较多的是收集和储存,分析和应用还比较弱。即使在投入较多的数据收集环节,由于缺乏相应的机制,数据的质量也不是很高。

业内者说:怎么做

在目前的情况下,如何做好大数据?高瞻认为,应当先抓住一些关键业务需求,同时数据基础比较好,先做起来,然后再逐步扩展。他举了两个例子。

好医生集团曾参与过安徽省肥西县卫生局的一个项目。据高瞻介绍,肥西县卫生局将新农合医疗报销系统的数据和卫生局为居民建立的电子健康档案做了一个关联性分析。结果发现,居民的肥胖、抽烟与高血压、糖尿病的发病关联性很强。高瞻告诉网易科技,这不是什么新的发现,但是应用大数据分析的意义在于,之前大家只是从概念上知道肥胖和抽烟会对高血压和糖尿病产生影响,用大数据分析之后,能够真实地看到具体的一个个人的肥胖和抽烟对病症产生了影响。之后,社区医院应用了这个分析结果,给高血压病人、糖尿病病人看病时不光降血压、降血糖,还要干涉患者的肥胖和吸烟。现在整个肥西、还有安徽的很多县都在推广这样的做法,这一个小小的改变,使得很多地方的居民电子健康档案的使用率从20%左右变成了60%—70%,医生们本没有使用积极性的数据库被激活了。

肥西还做了个试验。原来农村治病,不管大人小孩,一般都是开抗生素、输液,好医生集团多年来做乡村医生的培训,呼吁不要滥用抗生素,但是在实际中效果不大。今年年初,安徽省启动了基层医疗卫生机构处方集系统,这个系统可以根据疾病诊断,提示建议处方,旨在规范诊疗行为和用药行为。同时,从今年2月开始,肥西县卫生局每月把医生处方当中使用两种以上抗生素的处方的比例发给医生。结果到了10月份,原来高达20%-60%的数据降到了个位数。

高瞻总结,大数据应用应当先从“Low hanging fruits”,即挂得低的果子、容易达成的目标开始,先把手头有限的“小数据”用好。

这个观点与北京301医院计算机室原主任任连仲不谋而合。

任连仲告诉网易科技,目前中等规模以上的医院起码都积累了数百GB的数据,每100GB的数据就相当于30万份病历。虽然这个数量级还没达到PB级,但是其中一定蕴含着许多有价值的信息。

他拿自己的观察举例说:“我观察了我身边20个左右患恶性肿瘤的人,我发现其中六七成的人在生活中有过非常苦恼郁闷的一段时期。20个样本,就可以总结出一点规律了,何况这个样本量大到GB级呢?那会得到更多、更有价值、更准确的结论。”

他主张先把目前的数据利用起来,现在301医院那些成摞的申请单就是真实的需求。他说:“目前在医院里,这样的服务还是被动的,是医生找上门来我们才提供服务,如果这种服务再进一步走上主动,广而告之,告诉广大医护人员和管理人员我们这里可以提供你们所需的‘信息服务’,医生在和技术人员在不断交流的过程中,一定能挖掘出大数据更大的价值。”