3. 预测分析在医学上的应用
前列腺癌检查可早期发现癌症,但不是所有的病人都能受益于后继的治疗。因此,辨别出哪些病人最有可能患有侵入性癌症,将大大减少前列腺活检试验。我们收集了1,563例接受了前列腺活检的病人数据,采集10微克/毫升或更少的血清PSA数据,用预测模型对侵入性前列腺癌进行分析。用随机选取的70%的数据对预测模型进行训练,其余30%的数据用于对预测模型进行测试。在1,563例病例中,有406人患有癌症(26.1%),其中130人患有侵入性前列腺癌(8.3%)。预测模型创建了如下侵入性前列腺癌风险组规则:
1. PSAD大于0.165ng/ml/cc。
2. PSAD大于0.058 ng/ml/cc且小于0.165 ng/ml/cc , 年龄大于 57.5 岁且前列腺量大于22.7 cc。
预测模型经测试数据验证,模型对侵入性前列腺癌的敏感度为91.5% ,特异性为33.5%。在测试数据中,当PSAD 是0.058 ng/ml/cc 或更少时,侵入性前列腺癌的发病率是1.1%。因此,预测模型可以有效地识别侵入性前列腺癌风险组。当单一的高度前列腺癌诊断将导致后继的治疗时,预测模型可以减少33.5%的不必要的活检试验。
国外数据挖掘在医学上的应用
数据挖掘的很多理论和技术源自欧美国家,这些国家开展数据挖掘技术的研究和应用比较早,因此也有长年的数据挖掘的技术积累和经验积累。欧美国家对数据挖掘技术研发的投入比较大,不仅投入大量的资金,而且还配备了阵容强大的研发团队。这些国家对数据挖掘技术的应用意识比较高,因此他们对数据挖掘技术的研究热情较高,将最新技术应用于科学和商业的需求比较迫切,因此有大量的成熟的、应用稳定可靠的数据挖掘实际应用案例。由于他们比较早地应用前沿智能信息技术开展健康与医学方面的研究,现在无论从数据挖掘研究和应用的深度和广度上都走在了世界前列,并且很多科研成果已经转化为有形的技术与产品,直接得到了广泛的应用,并产生了显著的社会效益与经济效益。例如,数据挖掘在在医学应用于如下几个方面。