本篇将再多讲一讲数据挖掘在医学上的应用,希望能对感兴趣的朋友有所启发,也供从事其他行业数据挖掘应用的同仁参考。
数据挖掘,又称知识发现(KDD),是从大量的数据中抽取潜在的、有价值的知识的过程。数据挖掘所探寻的模式是一种客观存在的、但隐藏在数据中未被发现的知识。例如,数据挖掘可直接挖掘疾病高发人群,发现疾病及症状间的未知联系,探索化验指标间的影响关系及化验指标与疾病间的潜在影响,对未知的实验室指标值进行预测,可以探索合并症之间的关系,还可以自动发现一组高维实验室指标变量的异常等等。再如,在科研设计中利用聚类分析,我们可以对数据进行科学分组,通过考察多因素的不同影响权重,可以帮助确定析因分析或嵌套分析等不同的科研设计等等。数据挖掘在医学中应用非常广泛,它必然为医学临床和科学研究提供传统方法不能企及的又一种前沿技术手段。
国外数据挖掘在医学应用上的案例
数据挖掘在国外各行各业得到广泛的应用,医学领域也不例外,很多数据挖掘技术被成功应用到医学临床和科研方面,下面就列举几个简单的案例。
1. 聚类分析在医学上的应用
糖尿病是世界上一种常见的疾病,超过18万美国人患有糖尿病,另有16万人糖尿病处于糖尿病前期。糖尿病的临床诊断往往是从身体症状和化验值异常着手的。有些异常指标包括身体质量指数( BMI ),血压( BP )指数等。利用聚类分析工具可以分析患者的疾病诊断数据,以进行探索性的数据分析,并考察产生的聚类结果的意义。至于糖尿病患者的数据,聚类分析工具试图按照年龄、种族、性别、体重指数和BP指数等产生聚类模式,并将数据划分到相应的自然组群中。