瀚海基因贺建奎:大数据存储和分析依旧是基因测序的难题

2016.07.09 22:34 大数据概念股

6月16日,“魔方大数据之——基因大数据产业应用发展高层思享会”在上海贝壳社成功举办。超过70位国内基因领域顶级专家及国内外基因行业领袖企业代表共聚一堂,就基因大数据产业链各环节所面临的机遇与挑战进行了深度探讨。

本次活动由上海大数据联盟、数据猿主办,贝壳社、上海市生物医药科技产业促进中心、上海超级计算中心联合主办;得到上海市科技创业中心、上海市浦东新区科学委员会、上海众创空间联盟的大力支持。

以下是数据猿现场整理的“瀚海基因董事长贺建奎”的精彩分享:

贺建奎:非常感谢,也非常抱歉,由于飞机的原因,来的比较晚。我代表瀚海基因,来给大家介绍一下我们公司过去几年的发展情况。

市场上第一个出现的,不一定是最后成功的

瀚海基因,2002年创办,到现在已经有几年,我们主要从事基因测序仪的研发、生产和销售。在国内,这并不算是主流业务,因为测序仪属于整个行业的上游。就我个人来看,现在做仪表面临的挑战主要有两点,其中我们比较关注的是高通量测序技术,另一个是大数据的存储和分析。

高通量的测序技术已经发展了很长时间。1987年左右,自动化测序技术出现,产生第一代测序仪。2000年到2003年,二代测序仪推出。最先发明测序仪的人叫沃森宝,一个著名化学家。“第一个出现的不一定是市场上最后成功的”。后面的公司实施收购后吸取了第一家公司的经验,然后就在二代测序仪市场上占有了一定地位。

刚入行的人,你问他们用什么测序仪,他们可能只知道Illumina(第一代测序仪)。第三代测序是单分子测序,首先提出这个测序原理的是斯蒂文,他的公司2007年在美国纳斯达克上市,但是到2008年还没有开始销售就遇到金融危机,哪怕上市也融不到钱,后来卖了十几台试用机,一台150万美元,最后在金融危机下公司做空,直接做到50美分就“挂了”。美国有一个规矩,一项技术原理发布到某一公司,公司产生上百项专利,一项专利孵化一家公司。为什么现在市面上的测序仪公司,美国就那么几家,因为只有这几条技术路线被开发出来。然后说说我们公司,是怎么来的呢?当时我们在美国很难再做的更好,大家聊了很多,觉得失败是大环境引起的,但前景还是好的,所以我们决定回国做测序。

2014年刚开始的时候,大家都不相信我们能做出来,尤其是我们这么年轻的人,如果国家找几个院士来做可能靠谱一点。但幸运的是,有好的技术,就有好的成功方式,拿过来抄一下,这是过去十年来在中国比较成功的方法。当然,我们不是从美国拿回来技术直接用,而是重新开发,并得到了美国的支持。当时,大概有20个顾问,每月的顾问费都要几十万,所以我们觉得必须要从源头上拿到专利和人才。在深圳、上海,资本比较活跃,我们招来了最优秀的人才,有十几个博士,几个海归。

100美元做测序,这就是未来

测序仪这个行业,跟大数据不一样,大数据是瞬间爆发的,但做测序仪,通常是要五年才能做起来。做药品要十年,做创新的医疗器械是五年,从开始研发到最后全面占领市场,大概又五年时间。我们做这个事情的出发点在哪里呢?我们都知道测序仪便宜,越来越便宜。早在2003年测序仪就已经形成了市场,市场价是30亿美元,后来美国非常有前瞻性的提出了一个理念,他们要实现1000美元做测序,于是资助了很多公司做技术做开发,现在确实也接近1000美元了。

接下来,业界都在想,能不能100美元实现一个基因组测序?这是什么概念?1000美金,大部分的研究项目都可以测了,做研究嘛,不计较成本。任何一项新技术,首先都要在科研里面广泛使用,然后三四年后进入临床,在临床爆发应用。但在临床1000美元的价格也还是太高,那么什么价格合适呢?最好是100美元。这样每个人都可以做,普通人也能接受得了这价格。1000美元,一万人或几万人做可能没问题,但做到100美元,才属于普通人、上亿人都能做的测序。当然,这不是现在能实现的,五年之后才能实现。100美元测序,将成为每个人都可以做的事,这就是未来。

第一代测序价格是30亿美元,第二代是1000美元,一周时间可以测,第三代我们还没有实现。为什么第三代100美元就可以,而二代再怎么做都很难达到这一水平呢?这是因为云建设。如果PCR是上百万条,就需要大量的酶和试剂,耗材成本降下不去。第三代是单分子测序,可以从根本上降低成本。我们的任务是再过三五年,微量测序就是100美元的水平,这个目标只有第三代测序能实现。回到我们的产品,单分子测序平台,我们叫GenoCare,Care是关照的意思,现在已经逐渐从科研领域转向临床。在座的可以看到,三四年前是测基因组最黄金的时代,现在做一万个才有可能发现一个。这个基因测序的技术,跟所有的技术一样,在科研领域的应用是四五年以后,之后是临床应用,也是未来市场爆发的阶段。斯蒂文我很熟。2013年以前,他公司的市值是200亿美金,大家觉得他太牛了,但是后来发现,他的产品并没有在临床上应用。不能走到临床,就无法获得价值,这就是为什么被收购的原因?二代测序,或者三代测序,开始做的时候都有忧虑,但现在考虑这些是多余的,因为它确实可以用于临床,第三代是有持久发展前景的,会带来一段时间的繁荣。

这是我们做的测序仪,因为商业原因,展示的不是最后的产品,最终的设计10月才会公布,是我们在上一代基础上进一步设计的。三代测序仪拿过来就可以测,这是我们提供的解决方案,可以直接拿报告。去年10月,我们第一次做出样机,今年4月,做了第二批产品,还办了一个鉴定会,专门刊发两页文章报道这事。我们一直坚信只有最好的科学,才能有最好的公司,最好的产品。

这项技术到底有什么特点呢?可以做定位靶向测序。我们生产的测序仪上带有十个基因探针,测出的结果是一步式靶向测序;我们用的化学体系和Illumina完全不同,测序全程只用2种酶,而Illumina需6种酶。二代测序时间非常长,而三代测序第二天可以拿到结果,不仅时间短,还不需要PCR,解决了实验室建库成本高且使用者操作难度大的问题。PCR污染一直是临床试验一个非常头痛的问题,为了杜绝PCR污染,我们做了很多努力,现在它可以广泛的应用在很多地方。这是陈润生院士。我们做出来的产品跟专家们讲,他们都很高兴。

数据不标准,很难被再次挖掘

实际上我们正紧锣密鼓准备做云计算平台,这是什么意思?首先,现在产生的大量数据专注在基因组方面,我相信未来基因组领域里的数据量比现在想象的规模还要大很多。不知道大家有没有看过美国NCBI(美国国立生物技术信息中心)数据,化学类文章发表之后,通常会上传到文库,所以那上面收集了海量的基因组数据,一直是以指数级增长。那么为什么已经有这么多数据,还会有那么多公司自己收集数据呢?

一个基本的观点是,这些数据虽然多但不能用。做数据分析的有一个认知,“垃圾放进去,出来的也还是垃圾”,你要做一个好的分析,但数据来源是垃圾的话,出来的东西肯定也是垃圾。大数据是全世界各个国家提交的,零散、碎片化、没有标准,但是有量。如果不是统一的方法做出来,要进一步分析基本不可能。虽然数据多,但能用的真的非常少。没有标准的数据,不具备挖掘可能性,也可以说很难再被挖掘。再来看数据的统计或分析,数据越来越多,那又是什么限制了目前行业的发展?网速、带宽。无论你在哪里测,都要把数据寄回来。现在各地都可以买测序仪,每家医院都想买一台,测序仪已经进入了平民化时代,跟早年高大上的“形象”不一样了。几百万的测序仪,对很多医院来说,不是特别大的仪器。不过,很多地方想买测序仪,面临的困难是不仅需要有专人管理,还有再买一个服务器,除了要收集信息,数据处理方面也要有诸多投入。所以,云计算是未来趋势。未来的测序不只是化学的,还是生物学的,只有这样才能产生更深远的影响,影响这个社会,影响健康产业。

大家花一百万买个机器,又要买服务器,还要有人照顾,价格估计就要翻一番。该怎么办呢? 这就是我们想解决的事。测序仪做出来之后,五年之内全国所有三甲医院,CPC总数达到上千台,每一台都可以直接插网线,无论是在北京、上海、武汉、云南、深圳还是其它地方,测序过程中把所有数据自动上传到我们的Space上,意味着医院无需再花几十万做这件事。一天几千台测序仪同步上传,这是一个很大的数据存量。

那么分析该怎么做?我们提供的解决方案是,数据全部上传后,我们自己或者与他人合作开发APP,测试的时候点一下,自动化分析报告就能出来,包括标准化的400个分析,有PGS的,也有常见疾病的。我举的例子很少,因为我们只做了几个,但我觉得可以做几百个,我们希望通过合作把这个事情做起来。从用户的角度来看,不需要买服务器,不需要有专门的人做这事,只要完成这个测试,用非常简单的方式得到结果。其实医生并不想知道生物学的一些事情,他们只想知道数据的分析结果是什么,究竟这个病人到底有没有病。

大数据概念股:东方国信、易华录、拓尔思、银之杰、东方网力、天玑科技、科华恒盛、宜通世纪、荣之联、紫光股份、海兰信、创意信息。

大数据概念股

那么问题来了:最值得配置的大数据概念股是哪只?即刻申请进入国内首个免费的非公开主题投资交流社区概念股论坛参与讨论!

0 0 0

守不败之地,攻可赢之敌!

我要投稿

申明:本文为作者投稿或转载,在概念股网 http://www.gainiangu.com/ 上发表,为其独立观点。不代表本网立场,不代表本网赞同其观点,亦不对其真实性负责,投资决策请建立在独立思考之上。

< more >

ABCDEFGHIJKLMNOPQRSTUVWXYZ0-9
暂无相关概念股
暂无相关概念股
go top