大数据“显影”:Ayasdi用拓扑数据分析癌症

Ayasdi

大数据蕴含的宝藏就在每个人的脚下,而Ayasdi这样的大数据创业公司能借你一双慧眼,从现有的数据中发现新的金矿。

最近,硅谷的创业公司Ayasdi最近刚刚完成了一笔1000万美元的融资,该公司利用拓扑数据分析的算法,来推动癌症的研究。

Ayasdi所代表的大数据垂直应用显然正在成为大数据投资的焦点之一,在IT经理网之前的文章:大数据的下一个热点在于应用软件中,我们曾指出:

就长期价值而言, 行业或细分市场的突破性大数据软件应用要超过目前火热的大数据基础设施平台。

旧数据里的新财富

斯坦福大学的学者Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton一直在致力于用拓扑学的方法, 进行数据分析。 拓扑学是一个很古老的数学分支, 从欧拉时代就开始研究,不过最近15年左右, 拓扑学开始和数据分析相结合, 用来发现大数据中的一些隐形的关系。 Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton在2008年, 觉得将这一技术进行商用。 于是成了了Ayasdi公司。 (Ayasdi来自印第安语, 意思是“寻找“)。 而Ayasdi的目标, 也是为了帮助用户从现有数据中进行一些新的发现。

用Ayasdi的创始人 Gunnar Carlsson的话说:

“人们先有数据, 然后根据这些数据提问, 按照不同的问题轨迹进行寻找答案。 而有的问题轨迹是正确的,有的则不一定正确。而Ayasdi的目标, 这是帮助用户回答他们还没想到的问题。”

Ayasdi成立以后,就获得了DARPA(美国国防部高级研究项目组)350万美元的资助。(编者:DARPA的很多项目都非常具有前瞻性, DAPRA的网络项目ARPANET就是现在Internet的前身)。 随后, Ayasdi的综合了机器学习和拓扑数据分析的技术引起了硅谷投资界的关注。

Ayasdi的技术的一个重要特点就是,不像别的系统需要类似搜索查询式语句。 Ayasdi可以自动从数据中发现隐藏的模式。

随着Khosla Ventures和 Floodgate等基金的投资到位, Ayasdi目前30人的技术团队将扩充, 同时将营销和销售也将展开。

Ayasdi的投资人Vinod Khosla 有句名言, 说将来80%的医生将会被机器代替。 他认为, Ayasdi的“机器智能”技术, 将使我们的探索能力达到过去难以企及的高度。从而帮助解决一些全球性的社会和经济问题。

让大数据“显影”

Ayasdi的一个应用就是在医学研究领域。 Mount Sinai医学院基因与多尺度生物学系的主任Eric Schadt就带领了一个团队,利用Ayasdi的技术进行一些疾病的遗传倾向的研究。 这些疾病中包括癌症。 Eric Schadt希望这种技术能够帮助找到一些新的发现, 从而可能带来一些治疗上的突破。

事实上, Ayasdi一直在美国各个顶级医院和药厂合作。 医院和制药公司可以从公开的信息源获得很多数据, 和他们自己的数据结合起来,进行一些新的研究。

Ayasdi的CEO Gurjeet Singh说:

“数据还是那些数据, 只是我们用了新的技术, 可以从这些数据里自动地得出一些新的发现。”

通过对一个累计采集15年, 被成千科学家研究过的数据集的分析。 Ayasdi的数据分析技术,帮助发现了乳腺癌的14个变种。 Ayasdi的算法发现了某一个基因子组的病人乳腺癌的存活率比较高。如果病人的基因是在这样的子组里, 可以免受化疗之苦。

风险基金Data Collective 的合伙人Matt Ocko是一个专注于大数据领域的投资人,他看到了这个医学上的突破的新闻后, 决定给Ayasdi投资。 他说:

目前,政府和企业的问题,不在于数据量的缺乏,而是对数据进行发现和直觉能力不足。 Ayasdi的技术, 能够在短时间内, 提高分析人员面对海量数据的直觉能力,这一点是个突破。

对于医疗行业而言,大数据财富其实就在脚下,甚至在那些被遗弃的数据中,(在本站“Rich Smolan:大数据的人类面孔”一文中提到一个例子,麻省理工学院的计算机科学家和密歇根大学计算机科学家创建了一个全新的计算机模型,可以分析那些被丢弃的心电图数据,发现被忽视的心脏疾病复发信号,并能大大改进今天的心脏病风险筛查技术。)

Ayasdi获得风险投资的青睐,从一个侧面表明,数据直觉化和数据分析创新才是医疗大数据的发展重点。