解码生命 守护健康

钳制病魔,基因有招

2017-06-04 23:26:57英特尔商用频道

近期,基因组学研究领域迎来了一个重大里程碑:隶属于麻省理工学院和哈佛大学的博德研究所开源了GATK4的源代码,这一全球最受欢迎的基因组分析软件,如今又实现了重大进步。英特尔一直在推动这一在基因组学研究领域中具有划时代意义成果的完成。

 


 

 


 

英特尔和博德研究所开发了一个名为 “博德-英特尔基因组学堆栈(BIGstack)”的突破性参考架构方案,这一方案采用英特尔处理器、Omni-Path Fabric和固态盘等技术,使得博德基因组学分析流程提升了5倍的性能。这个堆栈还包括针对即将发布的英特尔CPU+FPGA集成产品的优化。

 

同时,在应用层面,作为中国基因组学研究领域领导者的华大基因宣布采用最新的GATK工具,包括博德和英特尔的优化方案,从而在快速发展的基因组学领域中迈出向全球化联盟进军的突破性的一步。

 

此外,华大基因还宣布:将在与阿里云合作的华大基因在线平台(BGI Online)上提供GATK4、博德的工作流管理系统Cromwell和WDL(工作流定义语言)。这意味着中国和美国领先的基因组研究机构将使用相同的开源软件工具,同时也推动了数据标准化和共享,有助于未来进行体量更大、更好的科学研究。


 


 

强强联合,抗击重症

 


 

促成英特尔与博德合作的最首要原因就是英特尔和博德有着共同的愿景——充分发挥基因数据的威力,把这些数据广泛地提供给全球各地研究人员,推动重大科学发现。基因组学提供了有关生物体DNA内部工作原理的信息,同时基因组学的进步也推动了探索性科研工作,帮助人们更好地理解生物系统的复杂性。


 

几乎所有人都了解癌症给患者及其所在家庭会产生怎样灾难性的影响,英特尔与博德研究所携手加强基因组学研究解决方案正在帮助人们进一步从分子层面理解癌症和其它疾病的诱因,并加快实现精准医疗。


 

这也是英特尔和博德推出BIGstack的原因之一。它以此前版本5倍的速度运行新的GATK4 Best Practices分析流程,支持空前的海量数据,并通过生产环境就绪的脚本来简化部署。基于英特尔处理器、Omni-Path Fabric和固态盘的组合,提升架构性能。BIGstack还包括基于英特尔FPGA的优化,早期结果显示,有望在PairHMM算法上实现超过35倍的提升。


 


 

英特尔前沿技术助力科学取得突破

 

 

博德-英特尔基因组学堆栈的1.0版本帮助基因组学分析社区的建立方面节约了大量的支付成本。去年11月,英特尔与博德宣布在五年内投入2500万美元,建立英特尔-博德基因组数据工程中心,而建设基因组学分析社区也是这项合作的一部分。英特尔-博德基因组数据工程中心位于剑桥,该中心进行的重大优化已经包括在GATK4中。


 

英特尔希望BIGstack能成为全球领先的基因组研究机构的高级分析工作负载的通用平台,推动合作和科学突破。而这套“交钥匙”解决方案将作为参考架构,提供给原始设备制造商(OEM)和系统集成商,其中包括联想、HPE、浪潮和Colfax等等。 


 

长久以来,英特尔不断以先进技术推动科学上一个又一个的突破,这些成就让人们相信,我们会在有生之年看到癌症不再成为绝症。而英特尔与博德、华大基因等领先机构的合作,正让这个梦想成为现实。


 


 

展望未来,对于基因变异复杂的相互作用以及治疗如何影响分子路径的研究,需要基于对样本的反复学习来完成,而这将成为机器学习新的研究领域之一。通过与全球菁英的合作,英特尔工程师正在运用人工智能来应对即将到来的重大挑战,英特尔,让人工智能成就未来。