探索大数据背景下的基因研究

框4:BAM文件再校准。
  • 框5:GATK进行变型提取。
  • 应用中心目录可用云数据浏览器进行配置,来管理基因组计算需要的数据。在基于站点的浏览器中,用户可通过浏览和搜索所有远程或本地存储服务器(数据集线器)的文件和目录找到基因组数据。无论文件在哪里,都可以追加文件启动作业。使用数据浏览器,用户可通过标记文件目录快捷的找到它。例如,一个为基因组计算用户标记的可用目录能用来存储经常访问的参考数据集。

    最后,数据浏览器也可以方便数据传输,用户可把文件从浏览器桌面拖放到当前远程目录以同时上传多个文件。

    实时监控

    应用中心监控还需提供了一个基于门户的仪表板,提供全面的负载监控、报告和管理功能。作为监控工具,不仅单方面专注于系统监控,还提供完整的、集成化的负载监控设施。通过基因组应用程序的多样化配置(如大内存、并行或单线程),跟踪和汇总同作业与应用程序相关的计算机CPU、内存和存储I/O实用信息,帮助提高应用程序效率。

    结束语

    为了满足基因研究对于速度、规模和智能化的苛刻需求,面向负责创建和提供生命科学解决方案的专业技术人员(如科学家,咨询顾问,IT架构师和IT专家等),该领域出现的端到端参考架构正结合各种基础设施和信息技术被部署到越来越多的研究机构中,而基于这种架构的客户和合作伙伴生态系统也在不断生长,逐步丰富着相应的解决方案和产品。随着技术的发展,基因药物有望彻底改变生物医学研究和临床护理。结合生物学途径、药物相互作用机理及环境因素对人类基因进行研究,使得基因科学家和临床医生有可能识别疾病高危人群,为他们提供基于生化标志的早期诊断,并推荐有效的治疗方法。