几个世纪以来,科学家们收集并保存了大量关于植物的信息,据统计科学家每年发现大约2000种植物,并要与分布在全球自然历史博物馆和研究机构的400,000种已知物种进行比较,最后才能对其进行定义。
在过去的几十年里,这些数据大部分进行了数字化,随着AI技术的成熟,哥斯达黎加理工学院史密森学会的研究人员们开始试图通过计算机视觉和GPU的结合,使用卷积神经网络来数字化自然历史收藏,对博物馆标本栏中记录的生物进行基于图像的识别,从而加速和深化科学对植物生物多样性的理解。
为了支撑这个项目,哥斯达黎加团队使用两块NVIDIA GeForce GPU,以及开源深度学习框架Caffe和cuDNN,并用26万张图像进行卷积神经网络培训。
利用AI技术,研究团队能够在短时间内做更多的科学研究,研究团队希望通过全新的技术为引发生物信息学领域的新革命。同时团队还将在植物研究的基础上,延伸至昆虫、鸟类、鱼类等学科中去。