解码生命 守护健康

技术大爆炸!基因检测走进$100时代

2017-07-20 08:04:18大米社区

 

人类用30亿美金的预算,消耗16年的时间,完成了历史上第一次全基因组测序。这是人类对自身生命遗传信息的第一次探索。伴随着基因测序技术的不断发展,尤其是新代技术的普遍应用,基因检测的成本已经大大降低。那么基因检测和我们到底有多近?有什么帮助呢?

 

基因检测可以分为两个步骤:测序->计算/解读基因检测之后是干预/精准医疗。下面我们就几个方面详细解读一下。

 

 

基因检测:健康多活30年

 

基因组测序费用不断降低

随着测序技术的不断进步,基因组测序的费用从2001年的1亿美金下降到2016年仅用1000美元即可识别出人类基因组,完全超越了摩尔定律。有人大胆预测到2019年,对于单个人的基因组测序费用将只需要1美元。下图展示了这些年来单个人基因组测序的费用的变化。

 

Illumina

推出NovaSeq系列,剑指100美元

2017年1月9日摩根大通医疗健康年会上,Illumina公司宣布推出NovaSeq系列测序仪。Illumina指出这个全新的测序框架将重新定义高通量测序。其无可比拟的通量简捷的操作低成本以及灵活性有望将基因组测序的成本降低至100美元

 

NovaSeq是Illumina至今推出的最为强大的测序仪。设计它的科学家希望它能够满足研究人员对下一代测序技术的需求,并且降低大规模测序项目的难度。它一次运作能够对3-48人的全基因组进行测序,并为比对肿瘤-健康组织的超级深度测序(ultra-deep sequencing)、与复杂疾病相关的大规模基因变异分析等领域提供全新的市场。

 

“我们将Illumina的NovaSeq系统整合入HLI测序中心,和已有的HiSeq X系统形成互补。能够成为最先使用这系统的人之一,我们感到非常兴奋。”Human Longevity的共同创始人兼执行主席Craig Venter博士说道。

▲Craig Venter博士是率先使用该系统科学家之一

 

“NovaSeq的到来标志着Illumina创新历史上的重要篇章。2010年,HiSeq系统使得1000美元的基因组测序成为可能。我们相信,今日我们带来的NovaSeq框架,将在未来使得100美元完成基因组测序成为可能。这会让我们对复杂疾病的了解更深,带来更好的治疗方案。”Illumina主席兼首席执行官Francis deSouza先生说道。

 

NovaSeq框架包括了NovaSeq 5000与NovaSeq 6000两种机型。NovaSeq 6000将在2017年3月开始向全球送货,NovaSeq 5000的预计发送日期则为2017年中旬。

上图比较了新的测序仪和上代测序仪的输出

 

 

数据量爆发,计算解读加速

生命科学的理论化进程是从观察研究到实验研究,最终到理论研究。为了了解人类自身的奥秘,数据驱动下的理论研究成为主流。基因组计划通过分子生物学手段获取信息,利用生物信息学方法破译信息。随之带来了大量需要存储、传输和分析的生物信息数据,如基因组学、转录子学、蛋白组学、微生物学、表观基因组学和非基因性的外环境影响因素等。相关数据容量已从KB(千字节),MB(兆字节),GB(吉字节),TB(太字节)跨越到PB(拍字节),它们之间后一级都是前一级的1024倍。

 

数据压缩和信息计算成为领域最重要的问题

众多基因、癌症、医学研究机构和制药公司不断产生的海量数据,已不再能被及时地处理并恰当地存储,甚至通过常规通讯线路进行传输都变得困难。生物信息云计算中出现了两个最重要的问题——数据的压缩生物信息的计算。我们知道,只有高效的压缩才便于大规模向云端传输数据,降低云端存储成本;只有高效的计算才能充分体现云端弹性计算应有的优势。这两个问题的重要性不言而喻,解决好这两个问题,就能站在技术制高点上,推动生物信息云计算行业的发展。

 

基因大数据公司群雄逐鹿

目前,全球的基因组云数据市场可谓“群雄逐鹿”,数据的分析处理是整个基因云数据市场中的关键难点。目前全球涉及基因大数据的公司数以百计,Seven Bridges Genomics、DNAnexus、NextCODE、Galaxy、BaseSpace(Illumina)以及国内的华大基因、百迈客生物科技、人和未来、赛福基因、聚道科技等公司,都先后加入基因云数据服务的市场,开始抢占自己的市场份额。

 

中国新秀

人和未来19分钟完成全基因组分析

 

2016年11月4日,基因组云计算技术开发者大会(GCTA)在第11届国际基因组学大会(ICG)上正式公布了历时6个月的全球公开竞赛结果。

  

本届大赛由今年4月份成立的“中国生物信息云计算产业联盟”倡导发起,集聚华大基因、阿里云、英特尔、百度开放云、华为等单位的技术开发力量,通过汇聚BT和IT行业精英,共同解决基因组学数据大规模存储和计算等方面所面临的挑战。


300多家BT和IT参赛精英的团队人和未来脱颖而出,成为本届大赛的黑马。该公司在数据压缩计算加速两个项目上的成绩均刷新了世界纪录,同时保持了最低的计算成本,将全基因组的计算分析带入百元(16$)时代。

人和未来CTO宋卓博士代表GTX团队领取奖杯和证书

 

 GTX Compressor是该公司开发的通用数据压缩打包系统,可以对任意基因测序数据的目录进行高压缩率的快速打包,形成单一压缩数据文件,以方便存储档与远程传输、校验。在数据压缩存储的比赛结果方面,该系统在达到7个测序质量值下,压缩率达到1/18;在33个测序质量值下,压缩率达到1/8。

 

人和未来

Gzip

数据大小

101.2GB -> 5.6GB

101.2GB -> 20.4GB

耗时

0h20m49s

1h51m45s

压缩率

5.6%

20.1%


GTX Compressor数据压缩系统的简易流程

 

人和未来的Genetalks全基因组分布式计算平台基于亚马逊AWS云计算平台构建。该云平台具有良好的可扩展性,能够根据计算需求自动扩展集群规模,从而缩小测序计算时间。同时,该云平台能够根据亚马逊spot instance的动态价格以最优的方式申请使用AWS机器,从而最大限度的降低计算费用。在基因加速计算的比赛结果方面,该平台近19分钟就能完成400G 55x的人类全基因组分析,超越了以前国外公布的一个小时的最好成绩。对比单台标准服务器,数据分析速度提高了90倍,可节约75%的云计算机时费用。

全基因组测序所需计算的各个步骤

 

人和未来生物科技自2009年在美国开展基因检测的转化研究,于2014年7月在国内成立公司,目前专注于依托基因和信息技术为客户提供精准健康精准医疗的解决方案。人和未来目前的基因检测业务布局分为健康管理临床诊断两大块,同时依托其BT+IT的技术优势,正积极开展基因大数据的高性能计算和深度解读的业务


目前,人和未来合作的医院约300多家,健康管理等机构约几百家,累积样本数已突破30万。与其他还处在投入阶段的精准医疗公司不同,人和未来在成立2年以来,一直实施健康和临床市场并重的拓展战略,第一年就实现盈利,今年销售额近亿元。下一步计划中,人和未来将会申请与遗传疾病、肿瘤相关的CFDA认证产品,意图用创新技术垄断临床细分市场;并在健康管理方向着力打造检测、干预、解读和宣教的闭环。


人和未来于2016成为高新技术企业,不仅具有高通量测序临床应用的全部资质,还是基因信息大数据应用技术工程研究中心。目前的团队规模已达250人, 其中以博士以及行业资深开发人员构成的BT和IT研发团队超过70人。在融资上,人和未来在成立之前就已获得了数千万的天使轮融资,2017年其将计划启动下一轮融资。


 

欢迎广大人才加盟人和未来生物科技:

http://genetalks.com/career.html

 

随着测序技术发展和价格的不断降低,以及数据处理的不断加速,基因检测的费用越来越低。根据最新的数据,我们完全可以期望在接下的一两年里,基因检测作为精准医疗的先遣队,将会走进家家户户。


 

基因检测与精准医疗

基因检测只是一个开始,是我们精准关注自我健康的开端。

 

基因检测机构提供基因检测后的数据分析、解读,报告出具、健康评估、健康管理建议等服务。每个检测机构,根据自身定位、产业布局、医疗资源等的不同,开展的后续延伸服务,尤其是私人定制的其他健康服务。

 

以人和未来生物科技为例,在健康管理领域,人和未来通过和保险公司、健康体检、健康管理机构等合作,为用户提供关于易感基因疾病风险评估、肿瘤早期筛查、肠道菌群等立体全面的基因检测项目。在临床诊断领域,人和未来以第三方医检所的形式为医院提供肿瘤液体活检、单基因遗传病、无创产前等检测

 

针对检测的结果,对不同的情况,采用针对性的处理和解决方案,这就是精准医疗的目标。例如:目前约有2500多种疾病已经有了对应的基因检测方法,并在美国临床合法应用,甚至基因检测已成为美国疾病预防的常规手段之一,美国癌症基因组图谱(TCGA,The Cancer Genome Atlas)收集了原发性肿瘤手术中切除的肿瘤组织进行NGS测序,已经建立30个最常见的癌症类型的资料。

 

 

总结

随着基因组测序技术的新突破,以及计算解读能力不断提高,基因检测已经进入到$100时代。基因检测切切实实走到了我们每个人的面前。通过基因检测,我们将可以更多了解到我们自己基因组的信息,这个可以在很多方方面面对我们的生活健康带来深远的影响。

 

目前精准医疗突破性地发展,新生物技术和传统医学的结合,使得基因检测更具有价值和意义。相信在不远的将来,更多的疾病和不健康的状况将会被我们的健康体系所消除。

 

扁鹊三兄弟,扁鹊能医大病,二哥能医病于起始,大哥能医病于未然。以后的健康体系可能就能医病于未然。

 

 

 

附加阅读:

布局精准医疗,人和未来从用户定位和BT(生物技术)+IT技术优势切入  ———36氪访谈

文章链接:

http://36kr.com/p/5055975.html

 

精准医疗简介

精准医疗的概述

精准医疗(Precision Medicine)是以个体化医疗为基础、随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。其本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对于大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对于疾病和特定患者进行个性化精准治疗的目的,提高疾病诊治与预防的效益。


精准医疗具有精准性和便捷性,一方面通过基因测序可以找出癌症的突变基因,从而迅速确定对症药物,省去患者尝试各种治疗方法的时间,提升治疗效果;另一方面,基因测序只需要患者的血液甚至唾液,无需传统的病理切片,可以减少诊断过程中对患者身体的损伤。可以预见,精准医疗技术的出现,将显著改善癌症患者的诊疗体验和诊疗效果,发展潜力大。


精准医疗最新计划

 

2015年1月20日,美国总统奥巴马在国情咨文演讲中启动精准医疗计划。一期投入2.15亿美元。奥巴马“精准医疗”计划的第一步是希望招募100万名志愿者进行基因组测序。

 

2015年2月,习近平总书记批示科技部和国家卫生计生委,要求国家成立中国精准医疗战略专家组,共19位专家组成了国家精准医疗战略专家委员会。

 

2015年3月11日,科技部召开国家首次精准医学战略专家会议,并决定在2030年前政府将在精准医疗领域投入600亿元,其中中央财政支付200亿元,企业和地方财政配套400亿元。

 

2015年12月11日,“中国个体化用药-精准医学科学产业联盟“在上海正式成立,标志着我国首个精准医疗领域的产学研一体化联盟正式组建。上海交通大学贺林院士将担任联盟理事会首任理事长,中南大学周宏灏院士将担任副理事长,西北大学陈超副校长将担任副理事长并兼任秘书长,国家精准医疗战略专家组成成员詹启敏院士也受邀担任副理事长。联盟首届秘书处设在位于西安的国家微检测系统工程技术研究中心(国微中心)。

 

在2016中国卫生信息技术交流大会上,中国科学院院士陈润生介绍,目前我国精准医学重大专项已经立项,并已通过两次评审,落实到60多个项目。

得益于大规模生物数据库的建立(比如人类基因组测序),高通量组学的发展(如蛋白组学,代谢组学等),以及各种检测手段的兴起,还有计算和分析大规模数据的发展,精准治疗飞速发展。目前精准医疗的主要进展集中在癌症治疗领域(病人存活率得到了显著提升)。

 

癌症的精准治疗理念

比起传统的病理报告,基因组测序信息能提供更加精准有效的分型诊断。目前NCI开展多项临床研究,目标是使癌症的分子表征成为准确的诊断和治疗的临床标准;鉴定和发展可匹配至肿瘤分子特点的疗法,成功地控制疾病。同时还开展基因组学和癌症生物学,免疫学和免疫治疗,癌症成像等方面的研究来配合。

 

癌症精准医疗需要基因检测和大数据分析来进行治疗用药指导。测序的海量结果需要通过大数据分析解码基因变异信息,如何正确地建立模型、去除噪音、筛选出有价值的信息就十分重要,精确性是关键。基因组变异有单核苷酸变异(SNVs)、插入(Insertion)、缺失(Deletion)、拷贝数变异(CNV),基因组结构变异(SV)等。现阶段生物信息学分析主要集中在分析人体基因组的SNV和插入缺失检测,样本量较少和NGS测序技术的局限使CNV和SV分析较少,精确性不够。


相关统计数据显示:目前约有2500多种疾病已经有了对应的基因检测方法,并在美国临床合法应用,甚至基因检测已成为美国疾病预防的常规手段之一,美国癌症基因组图谱(TCGA,The Cancer Genome Atlas)收集了原发性肿瘤手术中切除的肿瘤组织进行NGS测序,已经建立30个最常见的癌症类型的资料。除了DNA测序,RNA测序也是未来重要方向:最新有研究表明前列腺癌患者的RNA测序可以帮助诊断和预测哪种治疗方式更适合患者。

 

测序分析的结果可以用于用药指导:可以测药物反应分子标志,比如药物耐药性、药物代谢等的分子标志。从而预测病人反应,精确指导用药(下文将详细介绍靶向药物和其他疗法)。

 

测序技术的突破,极大的提升了我们发现肿瘤相关基因突变的能力。大规模的基因突变信息与肿瘤临床表现(如药物敏感性)的相关性分析,可以发现指导抗肿瘤用药的新分子标志,帮助发现哪些特定药物可以用于特定的DNA突变组合,从而大大提高用药的效率与效益。