印度将建造最大的生物识别数据库

  前英特尔工程师SrikanthNadhamuni于2010年9月帮助设计了Aadhar的技术平台,该平台目前在班加罗尔的Khosla实验室运行。他告诉我,这些数据包都经过2048-bit加密存储处理,一旦有未授权的调用尝试即触发自我销毁(self-destruction)功能。

  有关针对MongoDB的批评

  那么为什么Aadhar一开始要与MongoDB合作?这种合作关系是否会继续下去呢?

  Aadhar技术中心的助理总干事SudhirNarayana表示,MongoDB只是最初为数据检索所选择的几种产品之一,其他还包括MySQL、Hadoop和HBase。与只能够存储人口数据的MySQL不同,MongoDB还能够存储图像。

  但是后来Aadhar逐渐将大部分数据库方面的工作转移到MySQL平台上,因为他们意识到MongoDB无法处理大规模的数据,也就是上百万的数据包裹。

  目前他们已经在使用“数据库分片(databasesharding)”技术:将数据包裹存储在不同的机器上,确保系统不会在数据量增加时崩溃。

  这种做法帮助Aadhar减少了对于MongoDB的依赖,而改用MySQL存储大部分数据。

  Aadhar技术中心的副总干事AshokDalwai告诉我,MongoDB无法调用任何生物识别数据。

  “我们认为使用开源技术可以避免过分依赖某一供应商的情况,但是这不代表我们以任何方式在安全方面做出妥协。”AshokDalwai这样说道。

  MongoDB方面的一位发言人在我们联系采访时,建议我们到该公司网站上阅读有关In-Q-Tel投资的声明文件。

  更重要的是,印度唯一身份识别局(UIDAI)早在这家创业公司从In-Q-Tel获得投资之前就开始使用MongoDB的开源软件技术。Crunchbase的数据显示,MongoDB仅仅在2012年从红帽(RedHat)、英特尔资本(IntelCapital)和In-Q-Tel三方募集了总共770万美元。

  Aadhar前景如何?

  抛开所有的争议不谈,Aadhar将于2014年完成录入超过12亿印度国民数据的目标,数据库总量将达到15petabytes。目前项目的进展速度是每天100万人,从明年开始将会实现每天大约200万人的速度,将剩下的7亿人纳入此数据库系统当中。