2014中关村大数据日于2014年12月11日在中关村举办,大会以大会以“聚合数据资产,推动产业创新”为主题,探讨数据资产管理和变现、大数据深度技术以及行业大数据应用创新和生态系统建设等等关键问题。大会还承载从政亚信府主管部门到各行各业的需求和实践中的疑问,探讨包括政府、金融、运营商等部门是如何通过数据资产管理和运营,实现转型发展和产业创新的路径。
在下午的政府@Big Data论坛中,亚信政企业务咨询部高级顾问丁涛带来《大数据让医疗更智慧》主题演讲,从应用的角度对大数据进行解读。以下是丁涛演讲的全文:
丁涛:感谢包总对我的介绍,我看了一下,咱们目前还有很多人坐在这里,我相信坐在这里的人一定是关注医疗和关注健康的人,所以今天我给大家分享的主要是从应用的角度,刚才各位领导可能从不同的角度对大数据做了一些自己的解读,我主要从应用的角度来对大数据做一些解读。
大家看一下,我这个标题是大数据让医疗更智慧,下面有一个图片,就是一个小人拿着一个问号,拿着一个感叹号推倒这个问号,就是说首先感叹号代表着我们对大数据的信心,我相信大数据将来一定会在医疗领域在更多的领域发挥作用,问号代表着我们目前在处于这个起步阶段,我们让大数据发挥作用的这个路上,将会面临更多的问题,可能我们会用我们的信心,感叹号代表我们的信心,一步步把我们的问题解决。这是我对大数据一个基本的看法。
然后我的分享主要包含四个部分,一个就是背景分析,行业聚焦,第二个看看我们这个行业都有一些什么事件发生,第三个就是我们在智慧医疗领域的一些探索,最后我们简单提一下数据变现的这个话题。
背景就是说先看一下我国医疗服务和费用支出情况,这一块大家主要看2013年的这个情况,从人均就诊次数来讲已经达到5.4次,这个数全国的平均数,北京的数没有拿出来,北京的数大概是人均7.5次左右,这个是不是跟北京的环境有关,不多说。再看一下医院病人门诊和住院费用的情况,这一块门诊费用就是按人次来算是达到206万,人均住院费用是7400多块钱,这个费用还是蛮高的。从全国来看,我们的卫生总费用是3万亿,占了GDP的5.57%的这个比例,这个比例也蛮高的。看一下我们未来的健康风险,这个就是老龄化社会大家都知道,这个会越来越严重,我们的老龄人也会越来越多,还有一个卫生部的统计,就是说中国确诊的慢性病的人口有多少?超过了2.6亿人,其中分了一些高血压、肥胖的,这个数字都是很大的,因此就是说,因为这些慢性病造成的死亡比例占到了85%,而且这个有向年轻化蔓延的趋势,我国城市的白领阶层亚健康的比例也是很高,76%,这一块的话,是我们人口的一个健康风险的数字,就是我们医学敏感人群数,这个是3.3亿增加到6.03亿,我们将在2005年到2015年间造成的损失达到5500亿美金,这是一个数据。因为今天我们主体是大数据,所以今天的片子里有很多是用数据说话的。
然后看一下我们IT人的健康状况,各位有很多是从事IT业的对这个也比较关心,第一个加班是成常态,这是一家上海公司做的,就是说我们有超过七成的程序员是超时工作的,其中有5.7%的程序员每周工作在70小时以上,另外增时不增收,我们工作加班累到腿发软,但是我们没有拿到拿钱手发软,从这个效率来讲,我们工作时间其实提升了21%,收入只提升了5.2%。由此造成了就是说有五大疾病在困扰着我们这些人群,像猝死、慢性疲劳、颈椎病,猝死这一块大家都知道,前期也看了一些数据,包括我们很多的大型的IT公司,像百度、华为像金山,不知道有没有这些同事,确实存在着猝死的现象,万幸的是我们亚信没有。另外就是说,上海社科院还有一个统计,就是说IT业过劳死在整个过劳死里面属于行业平均年龄最低的,只有37.9岁,作为我们IT人,我们应该明白,收入和健康是不成正比的,我们再忙也要关注我们自己的健康。
回到医疗体系这一块看一下我们面临的问题,从三个角度来看,从患者的角度,看病难、看病贵、看病乱是大家知道的问题,还有三长一短,就是我们等候时间长、排队时间长,而门诊时间短。另外从医生医院的角度,他的效率他的质量成本增长都是很快的,效率也不是那么高。从政府的角度,政府监管以来没有依据,很多地方政府也发现了,他也知道有骗保的行为,有医院有病人多报的行为,但是这种行为他没有依据,你没有办法查出来,医改难,现在我们医改也是进入了深水期,越来越难,另外补贴多,造成这些问题的根源可能有很多方面,这里列举了一些,不是特别全面,但是一些重点的我们可以关注,像我们的医疗资源短缺且发展不均衡,另外我们以药养医的这个顽疾一直存在,另外我们很多的人群都是重治疗轻预防,我们在不生病的时候可能不注意保健,但是治疗的时候我花多少钱都愿意。另外我们也缺少一些分层医疗体系,我们医生的服务半径也受到一些限制。
这个是我们十八届三中全会提出的一些医改方案,看起来很多,2014年政府工作报告也特别提出针对这些医改方案也确定了一些目标,我们记录几个关键词就可以了,第一个就是它有一个叫五措并举,三一联动,五措就是医疗保障,医疗服务、公共卫生、药品供应、监管体制,三一联动就是医疗、医保和药品,另外还有就是分级诊疗这个模式,现在各地也在探索。另外我们作为IT人要特别记住,充分利用信息化手段,来促进优质医疗资源纵向流动,加强区域公共卫生服务。最后还有一个允许医师多点执业,我们记住这几个关键词就可以了。
然后从国家各个部委各个委办局他也在促进移动互联网医疗,像国务院和药监局都出台了一些措施。背景是这么多。
我们看一下行业内近期发生了什么事情。先看一下我们医疗健康整个的生态圈,他包含了最里面的相关于我们的医生和患者,这个是核心的,外层有一些需求,他们有不同的需求,最外层围绕了很多的机构,包括政府、公司、科研院所还有医院,这都是我们的产业生态圈,包含了很多,其实外延还有很多。我们再看一下进入医疗市场的有哪些厂商,这一块我们有一些运营商还有一些智能可穿戴设备,还有一些新进入的移动的APP互联网上,最主要的一块阵地在传统医疗信息化厂商,像万达、像置业还有一些其他的厂商,他都从传统的做局部的信息化这个产品来逐步向智慧治疗转变。包括设备上,像华为也做了一些行业的解决方案,在推一些自己的理念。另外还有一些大型的集成商,都向这个医疗领域进军。
互联网医疗这一块是受热捧的,我们看一下近期的投资项目就可以看到,目前能够统计到的有8起这个项目,总共有4类,第一类是穿戴式设备,一共有16个项目,医疗服务类有10个,还有移动医疗应用类有13个,还有健康应用项目类获得投资是6个项目。这个也是大家比较了解的,像BAT也在布局应用医疗,像阿里最近石家庄搞了一个阿里健康的APP,就是医生看完以后,通过手机拍下来,在网上进行竞价,各个药店可以进行抢拍,三巨头都在进入这个移动医疗市场,在进行一些布局。这个是行业的一些情况。
我们作为亚信来讲,我们在做一些什么事情呢?看一下。我们关注是大健康,大健康这个概念就是涵盖了医疗、食药安全、环保包括养老等等领域,我们是关注跟健康有关的各个领域,目前我们可能会从医疗这一块先切入进去,看一下我们亚信团队任何谈大数据的时候,我们有自己的一个视角,我们把大数据比作一个店一样的,我们做几件事呢?一个是发电,我们就是汇集多方的数据,我们形成信息资源的一个发电厂,然后我们再进行输电,输电的意思就是我们利用这些新兴的云计算比如互联网这些设施,我们实现信息资源一个低成本的输送、传递,另外我们还有变电,我们利用大数据云计算各种工具能够把这些原始的数据提炼成信息提炼成知识然后进行多层次的加工,使这些信息能够应用于我们的一些决策,最后配电就是我们把这些东西加工以后,形成这些信息,要配送到适合的人适合的地方,适合的场景,最后用电,我们把这些电储存以后,各个部门、机构或者企业都可以根据自己的需求来进行方便的取送。
看一下什么是医疗大数据,其实这个医疗大数据的概念我一直没有找到一个合适的词来形容,这里是用了一个,底下这个图是用了一个图,上面是我们自己写了一句话,我们觉得医疗大数据至少包含从居民的出生到死亡,全生命周期的数据,全生命周期应该包含了各个生命阶段的一个健康状态和行为信息,比如说从新生儿到婴儿到幼儿到学龄前,他在每个阶段前发生了一个行为和健康的状态,我们都要给他记录下来,记录下来之后形成的这个数据就是我们所要的一个医疗健康的大数据。
医疗大数据有哪些来源,我在这里面有一些从两个层次两讲第一个它有一些基础的来源,包含四个方面,第一个就是说科研机构的那些数据,第二个就是我们医患本身活动的报销和行为产生的数据,第三个就是临床的数据,这个数据量目前来看还是比较大,第四个就是病人行为产生的数据。在技术来源的基础上,我们认为还有一些根据现在的技术有一些拓展来源,包含一些什么东西呢?第一个我们知道物联网现在发展得很快,物联网将来每个人可能都会买一些手环穿戴设备,有意无意都会有数据的产生,将来都会会聚到数据库里面。另外我们移动互联网也会产生一些数据,还有我们传统的互联网,我们在互联网上的一些搜索或者是搜寻一些健康查询的一些行为,我们将来也有可能通过不同的手段把它汇集起来,这样我们整个的数据来源包括了传统和我们新兴的,这样会比较丰富,真正的可能会有大数据。
我们看一下这个数据是否足够大,到底有多少,这里是一个普通三甲医院的数据量,我这里只列了三个,HIS的数据是30-50GB,LI是50-100GB,RIS是10-30TB,每一个人合起来是750兆的数据量,一个普通的CT是150兆的量,标准的病理检查这个量比较大一些是5个G,这个数据量还是足够大的。我们看一下医疗数据的生命周期,这个医疗的数据不同的数据实际上国家对它有一些不同的要求,就是它的时间是不同的,像门诊记录,保存时间不得少于15年,这个是有规定的。另外就像住院保存得更长一些,有条件的医院的话,他可能会终生给他保存。另外从在线的时间来讲,影象数据在线数据要求是三年,三年前的可以进行离线归档,这是它的生命周期。
这个是根据生命周期包括前面一些单项的数据量我们大致测算了一下,就是一个普通中级城市的人口,他有可能达到的医疗数据量,这个是以一个三百万人口的城市做估算的,估计他二十年,他的数据量可以达到PB级,另外就是说,到2020年,医疗这个数据将增长到35GB,这是一个报告上说的,IDC最近出了一个报告,《数字宇宙驱动医疗行业数据增长》,它报告数据每年以48%的数据进行增长。
医疗大数据的特别我想跟别的大数据也没有什么区别,包括多样性、隐私性。我们看一下大数据的价值,像郭院长他是2012年就提到了,大数据是新财富价值,比石油还贵,麦肯锡也对大数据提了一个很高的定义,大数据就是生产资料。我们查阅一些报告也显示,医疗大数据的分析会为美国产生3000亿的价值,这个还是挺大的,数据要实现它的价值,我们觉得可能有几步走,第一步数据要变成信息,就是经过初步的筛选或者指标化以后,它要形成一个信息,达到一个初步可用的一个程度,另外从信息要加工知识,要通过一些挖掘手段通过什么手段,我们总结变成一些知识进行规则化,最后通过知识的应用,才能实现我们的智慧化,就是从数据到智慧,他的价值是在呈现几何级的增长。
智慧医疗的特点,这个是IBM官方网站的一个总结,我觉得他总结还是比较全面的,第一个是互联,他认为智慧医疗将来一定是互联的,包括医院、病人和各个相关的参与商之间都是相互互联的,达成无缝的程度。第二个是协作,通过智慧医疗能够消除信息的孤岛,能够达到协作的一个程度。然后是预防,就是说通过这个预防,我们可以进行自己的个人健康管理,能够预测疾病的一些情况,身体的一些情况,我们可以突破城乡与大医院之间的界限,我们可以把更好的服务提供给我们基层的老百姓。创新,这个我觉得是最核心的,所有的互联也好、协作也好、普及也好,我认为都会通过一些创新的手段来实现。最后是讲到安全的问题。
总结一下我觉得智慧医疗确实是一个非常复杂的一个系统、体系,它涉及很多的东西,包括像参与的角色很多,政府、卫生部门各种防疫部门、医院等等,涉及的领域也很多,像医疗方面有很多的专业知识、预防的健康教育应急也很多,涉及的层面也 非常多,有政策层面有法律层面,也有我们职业层面和保险层面的,技术也很多,我们谈到智慧医疗不光是一个大数据就能达到的一个智慧医疗,他还涉及到像云计算、物联网等等这些技术,另外也有很多概念,像电子病历、区域医疗都是新出现的概念。另外像各种考虑的主线目标都很多,所以我觉得智慧医疗一个非常非常复杂的体系。
我们对于智慧医疗怎么理解的?先看下面这个图,就是以前我们做这个医疗信息化也好,说智能医疗也好,主要从政府、公卫、医院的角度来讲,从它的需求出发来做这个信息化的,现在我们要做一个转变,我们要从医疗工作者、个人和从业者来进行转变,我们认为智慧医疗的核心不是技术问题,而是一个思维,就是说,我们能否用大数据的思维来智慧化的破解各种医疗难题,满足以患者、以各种人为核心的需求,推动这个行业实现产业价值。这是我对这个行业的理解。
先看两个案例,第一个这个机器的话,大家可能有的看过,它叫沃森,是IBM的超级机器人,它曾经在11年的时候在智力竞赛挑战自我中,打败了一个人的专家,他有什么用呢?现在IBM它为这个超级机器人专门投资十亿美金,成立了一个公司,这个公司做什么呢?他把这个能力开放出来,供有需要的企业在这上面进行计算,它这上面进行了很多,集中了很多计算和算法的一些能力,这样的话美国有一个保险公司,他用这个做了一件事,这件事他是帮助这个医生诊断这个病人的病情,为他保险公司七千万人的一个服务,另外他们还做了很多尝试,比如说在癌症治疗领域,我们知道一个癌症从确诊到确定这个治疗方案,这个周期大概在一个月到三个月的时间,他用了这个以后,把这个周期大大缩短了,缩短成一天。另外他在其他的保险领域也有一些应用,对于防止骗保行为也都做了一些尝试。
第二个案例,我们提出当大数据和人工智能碰撞以后这个结果会怎么样,上午听郭主任,就是管委会的一个副主任讲到,盖兹来中国参观的时候,也特别到百度参加了智能机器人的情况,当大数据和人工智能然后在医疗领域有什么碰撞?这个是一个采血机器人,它能够自动的进行采血,这个是一个远程诊断的机器人,他可以放在家里,你有什么病以后,可以通过它跟远程的医生来进行对话,给你出来一个检验报告和处方。这个机器人叫便携机器人叫大乌鸦,它是美国国防部推出的,它主要的目的是针对战场的伤兵治疗,还有偏远地方的人,还有太空工作站,宇航员如果病了可以用这个东西进行诊断。我们有了这些东西,我们相信在未来的话,我们可能不用直接去医院了,每个家里配上这样一个机器人医生,你只要把你的病情跟他说一下他就会给你一个处方,我相信医院的看病难看病贵,很多问题都会迎刃而解。
回到现实,因为我们谈了很多其他的一些情况,我们回到我们国家医疗信息化的情况,我总结一下,前面是我们国家卫生计划的十二五规划提出了35212这个工程,后面是我总结医疗信息化存在的问题,第一个问题是它的系统是割裂的,孤岛很严重,第二个就是流程是不统一的,不规范的,我们以前的信息化建设是以管为主,缺乏一个整体的规划和顶层设计,信息化发展是不均衡的,这个不均衡体现在我们东西部对信息化的发展是差别很大的,即使在同一个地区不同层级的医院,它的信息化水平差别也是很大的。我们在咸阳就碰到,他的一级医院信息化建设很好,但是你到他的乡镇级甚至村卫生室,90%的基础信息化都没有,所以同一地区的差别也是很大的。
然后基于我们的研究,我们提出医疗大数据社会化应用的几个方向,第一个就是制药企业,它可以协助企业进行医药开发,包括临床前的一些分析。第二个就是从医生的角度,它可以辅助医生进行治疗和一些辅助决策,第三就是从政府的角度,可以进行传染病的控制和新农合基金的防欺诈。第四是从病人的角度,可以做一些规划的治疗,包括一些早期的健康管理,这是我们对医疗智慧化的几个应用方向的总结。
下面是几个事例,针对几个场景我们做了几个事例,包括病情监控,我就不细说了。是怎么辅助决策的,然后用药的监控,可以根据个人的健康情况结合信息可以对不同人不同药量的监控。这个就是刚才讲的对药厂和科研机构他的新药研发,我们觉得这一块可以是一个应用的方向呢?是因为我们知道从医或者医疗行业的人都知道,一个医药品从研发到能摆到我们药店这个周期是很长的,这个周期是十五年,就是一个医药品的研发很长的,我们大数据在这方面是有很多发挥空间的。然后就是健康管理,医保监管,我们正在做已经形成了一个落地方案了,它的核心思想就是把病人和病床以及医生和建立这种关系通过医保集合人员的二次信息比对来确定现在他的医院是不是在进行一些挂床这种欺诈。
最后提一下这个数据变现,因为我们亚信这边也在推这个理念,就是有了数据之后,我们怎么样发挥它的最大价值,通过变现是一种很好的手段。变现的措施其实有很多,你可以形成一些这个报告,也可以开放一些能力,这都是变现的一种方式,通过变现的话我们可以把掌握的数据能够实现更大的意义,就是说我们说以前我们数据可能都在自己家玩,现在我们要把数据开放出去,大家一起玩,独乐乐的模式我们要变成众乐乐的模式,这样我们的价值发挥得更大,将来O2O的模式也是一种变现的方式,我们结合社区的信息化系统,跟社区周围的服务机构进行结合,然后通过我们对PHI这个系统,它包含的对于个人健康情况的一个了解,通过这个了解我们可以给他提供一些个性化的服务,由线下的服务机构来进行执行。这个变现举了一个例子,就是通过采集设备采集一些数据,可以有哪些变现方式,第一个变现方式就是有针对性的给我们每个人提供健康减肥训练的方案以及健身的一些方案,另外我们可以用一些数据跟保险公司他的新保险的一个精算和投保的情况进行一个辅助的政策。
最后要提一下,就是大数据的安全,因为刚才董总也特别提到了数据的安全,我觉得在大数据的发展过程中,也是要特别关注的。
最后总结一下,我们对于大数据在医疗行业的智慧化有以下几点,我们刚才谈到了,第一次就是说基于大数据的智慧医疗我们认为刚刚起步,在这个起步阶段我们需要各界的人士共同努力,可能会经过一些长期的探索。第二个就是不同地区根据医疗信息化程度的不同,我们智慧化的切入点可能会不同,我们有的人可能认为实现智慧化一定要有一个前提,就是说你的信息化水平要达到一定的程度,其实我认为不是这样的,就是不同信息化水平的地方,我们认为它的智慧化同样有一些切入点,只是看我们能不能抓住这些切入点。
第三个就是智慧医疗要强调以人的需求为核心,转变以前我们以管的思维,要解决患者、医生和管理者的矛盾和问题为出发点,要符合国家医改的大目标,以创新的应用为抓手,用我们智慧化的实现体制机制的突破,因为体制机制要深化改革的话,路还很长,我们有了大数据有了信息化有了很好的技术,可以智慧化体现一些体制机制的突破,然后化解医改的难题,提升服务质量。
最后想强调的就是我们讲这个大数据,很多人理解就是大数据本身,其实我认为可能包含三个方面,就是数据思维技术,大数据涵盖这三个方面,它为我们提供了一种新的看待世界的看法,我们要用这种方法来解决疗行业面对的难题。所以我们应该首先从思维上来理解进而指导我们医疗行业智慧化的进程。最后我们来做一道代售题,我们第一句是大数据是实现智慧医疗的基础,第二句是智慧医疗是实现公民健康和快乐的保障,第三句是公民的健康和快乐是实现中国梦的基石,因此,我们可不可以得出大数据是实现中国梦的一个基石。如果是这样的话,作为IT人肩负这样一个使命,我觉得是很荣幸的。谢谢大家。