沃森是自2007年开始,由IBM公司的首席研究员David Ferrucci所领导的DeepQA计划小组开发的人工智能系统,它是20多名IBM的研究员四年心血的结晶,并以IBM创始人托马斯?J?沃森的姓命名。因为科学家们的努力,沃森拥有了理解自然语言和精确回答问题的能力。
2011年,沃森在美国一档老牌综艺节目“危机边缘”里打败了最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯,从此进入人们的视野。
根据IBM的资料显示,沃森的硬件方面是由90台IBM Power 750服务器组成的集群服务器,这里面共计有2880颗Power7处理器,以及16TB内存组成。软件方面,沃森是由Java和C++写成,并且采用Apache Hadoop框架做分布式计算,还有Apache UIMA (Unstructured Information Management Architecture) 框架、 IBM DeepQA软件和SUSE Linux Enterprise Server 11 操作系统。
沃森为什么如此聪明?
沃森竟然可以在比赛中打败人类,它是如何做到这么聪明的呢?沃森储存了数百万的文档资料,包括字典、百科全书、新闻、文学以及其他可以建立知识库的参考材料。沃森的硬件配置可以使它每秒处理500GB的数据,相当于1秒阅读100万本书。
据IBM中国研究院的张雷博士的介绍,沃森在拿到一个问题后,会进行一系列的计算,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。沃森的主要技术原理是通过搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。其中的一个关键步骤就是评价备选答案的可靠性,从关键字、地理位置、类型等多个维度对答案的可靠性进行检测和量化的评价。
沃森的历程?
2011年,IBM公司说,鉴于“沃森”听得懂人类语言,可以通过询问病人的病征、病史,通过使用人工智能技术、对自然语言的处理和分析技术,凭借从各个渠道搜集到的信息和数据,迅速给出诊断提示和治疗意见。此后,美联社的记者亲自体会了机器人医生沃森如何为病人诊断,研发人员向“沃森”逐一提供一名虚拟眼疾患者的情况,视力模糊、有关节炎家族病史、住在康涅狄格州、怀有身孕……“沃森”提出了不同诊断结果,包括葡萄膜炎、白塞氏病、莱姆关节炎等。据测算,沃森的诊断准确率达到73%。
2011年,美国保健服务提供商Wellpoint公司与IBM签署了一项协议,这是沃森获得的第一份工作。沃森的主要任务是帮助Wellpoint负责复杂病例的护士完成工作,同时审查医疗服务提供者的医疗请求。以及后期在肿瘤临床试验中的应用。Wellpoint 总裁也提到,在未来,沃森也许还可以获取病人病历及其他方面的信息,然后综合反馈给医生,以提高医生的诊断速度。
2014年,德州大学安德森癌症中心与IBM合作打造“登月项目”,该项目通过采用IBM沃森技术来消除癌症。安德森癌症中心是美国排名第一且被全球公认的最好的肿瘤医院,该中心的肿瘤学专家顾问(Oncology Expert Advisor)由沃森认知计算系统驱动,旨在整合安德森癌症中心的临床医生和研究人员的知识。这个OEA系统将帮助临床医生制定、观察和调整癌症患者的治疗方案。IBM沃森技术还将简化和标准化患者的病历、实验室数据和研究数据的收集、整合上提供帮助,使得搜集到数据整合到安德森癌症中心集中的病人数据库,然后进行链接可以被高级分析技术进行深度分析。
除了安德森癌症中心外,梅奥诊所(Mayo Clinic)也在通过IBM沃森进行概念试验,以更快速、高效地给患者提供合适的临床试验。在任何给定的时间里,梅奥诊所都能够进行超过8000项人体研究试验。但由于没有足够的人参与报名使得很多的临床试验都无法完成,不管是在梅奥诊所还是在其它地方都如此。IBM和梅奥诊所正扩大沃森的知识语料库,纳入梅奥诊所及ClinicalTrials.gov等公用数据库,同时训练该知识库分析病人记录和临床试验条件提供合适的匹配。
泰国康民国际医院采用IBM沃森认知计算在曼谷研究中心提高癌症治疗质量,并在16个国家的机构进行病例评估。医院承诺未来5年将使用与凯特林癌症中心(MSK)共同开发的Watson for>