基因检测世界的商业逻辑
前期的大数据积累不到位,“读万遍”的时代不会开始。 
2015-3-2 11:40:15
0
罗奇斌


测序仪发展的瓶颈

孙洪业在接受《转化医学网》采访时谈到:“人们不再关心DNA序列是如何测出来的,而是关心它的结果对人类的健康和疾病意味着什么”。致力于成为世界测序工厂的药明康德,这一句话道出了测序仪的瓶颈,基因数据的获取已经成为一种标准化的服务,标准化的服务必然导致大规模的推广和进入门槛的降低,最终的结果会使利润和瓶颈向下游产业倾移。

测序仪本身已经不是瓶颈,但是测序仪发展会遭遇瓶颈。

众所周知,Illumina已经是世界测序仪供应商中的领头羊,从2007年收购Solexa押宝在DNA测序市场开始,到2010年华大基因使用从国家开发银行贷款的6亿购买了128台HiSeq2000测序仪,进入2014年以后,诺禾致源、药明康德和云健康陆续购入一套HiSeq X Ten测序仪(相当于120台HiSeq2000),Illumina赚得是盆满钵满。中国毫无疑问成为了世界的测序工厂。

2010年华大基因使用从国家开发银行贷款的6亿购买了128台HiSeq2000测序仪

测序仪在国内的发展小编预测大致上会经历三个阶段:

第一阶段:各家争先购买测序仪。

华大基因在2010年购买的128台测序仪,不仅让世界看到了中国土豪的出手,也让一些大型科研机构和不缺钱的企业蠢蠢欲动。从2010年到2014年,短短的四年,中国企业和科研机构购买进口测序仪的订单已经排到了世界第一。无怪乎美国人民惊叹中国人的购买能力不仅体现在奢侈品上,还体现在昂贵的测序仪设备上。

从国家基金对于购买设备的支持来看,这股热潮至少还会持续至少三年,从一线城市到三线城市,测序仪设备供应商Illumina估计在中国市场还没有赚够,接下来投入的精力,应该是在市场和销售模式上主力攻国内还没有醒悟过来的科研机构和中小型企业了。

第二阶段:测序仪租赁市场的兴起。

盲目购买测序仪的科研机构,也许在两年以后就会意识到一个很现实的问题:如何跟上测序仪的快速迭代和喂饱价格高昂的测序仪。目前测序仪基本上是每季度一迭代,从最初的每两年一更新到现在的迅速换代,使得众多刚刚购买了测序仪的用户在仪器配套的实验平台还没有建立好的时候,市场上已经出现了更高级更低价的替代型号。

另一方面,高通量的测序仪往往无法保证百分百的利用率,有的机构购买了测序仪以后,一年内只能保持不到一半的利用率。这些因素必然会导致国内测序仪整体利用率不高,同时各机构的基因测序质量也参差不齐。

基因测序市场的竞争会催生一个新型行业的诞生,那就是设备租赁公司的出现。只有这样的第三方机构出现,一片混乱的测序仪市场才能实现标准化和提高设备的利用率,同时国家对于测序仪的管理也能实现集中化和规范化。

第三阶段:测序仪云端化的萌芽。

测序仪的租赁市场一旦发展起来,基因测序行业就会进入高速发展阶段,整条产业链的重心会集中向下游的分析服务、解读服务、应用服务三个领域倾斜,基因测序开始实现规模化和自动化,只有这个时候,中国才真正进入“测序工厂”时代。

中国的“基因测序工厂”进入“规模化和自动化”时代以后,资本的推动和互联网思维的影响会让基因测序出现更进一步的升级。小编大胆的提出过一个预测,那就是测序仪云端化的萌芽。

奇云诺德的云端化解决方案

为什么是云端化呢?

和服务器发展的历程类似,从最初对服务器设备的盲目购买,进入到服务器租赁市场的兴起,到最后服务器云端化的出现和发展。目前测序仪也许经历的发展也会走上云端化之路。一旦个体化医疗推动基因测序市场走进老百姓的生活,测序仪的云端化能够让基因数据的获取不再有门槛,基因数据的存储、分析和解读也能在国家政策合理监管下迅速推广开来。

也许,只有经历这三个阶段,在具有中国特色的基因测序行业推动下,中国才能真正得到世界“测序工厂”的称号。

“测一遍”够不够?

本系列的上篇提到基因行业中的测序仪发展遭遇的瓶颈,一旦基因数据获取门槛极低的时代到来,一个问题会随之出现,那就是“测一遍”够不够?

以乳腺癌为例,目前科学研究发现,女性乳腺癌易感基因的某些突变位点和患病风险有关联,以此为基础科学家们能通过基因检测预测出每位女性患有乳腺癌的风险指数。这里“某些位点”有多少呢?基因公司又是如何选择“某些位点”呢?

回答了上面的两个问题,“测一遍”够不够也就清楚了。接着前面提到的女性乳腺癌基因检测例子,不同的基因检测公司选择“某些位点”的数目和类型是不尽相同的,这也是造成两年前美国《纽约时报》一位记者在三家基因检测公司接受的检测结果出现差异的主要原因。

美国《纽约时报》一位记者在三家基因检测公司接受的检测结果出现差异

有人不禁会问,能不能把所有的“某些位点”全部测完呢?

理论上是可以的,但是短期内无法实现这个目标。用业内人士的话来说这种全测的技术称为“全基因组测序”,小编在其他的系列文章里面曾经做过描述(具体参考小编发表的《下一位颠覆基因行业的是谁?》)。短期内全基因组测序技术还需要降低测序成本,目前已经可以达到千元美金内实现一个人的基因组测序,小编认为还需要降到一百美金内才能有大规模推广的可能。除此以外,测序周期也是一个需要解决的问题,能实现一天做完基因检测的技术还需要继续孵化。在消费者市场里面,需要“短平快”的基因测序技术,现有的一代测序技术,基因芯片技术,质谱测序技术,二代测序技术等都能实现基因检测的基本需求,小编认为“短平快”是市场选择的趋势,这里的“短平快”小编定义为测序周期“短”,价格“平”民化,解读服务“快”。因此,科学家和基因公司选择“某些”位点的标准一定是不同的。基因公司选择“某些位点”的标准受到“短平快”的影响。科学家们对于所有“某些位点”的发现永远不会停止。


现有的一代测序技术,基因芯片技术,质谱测序技术,二代测序技术等都能实现基因检测的基本需求

另一个问题是“测一遍”谁说了算?

医生?患者?还是需要基因检测的消费者?

既然无法“测一遍”就全部搞定,那就只能选择“某些位点”了。科学家们收集这些位点是需要时间的,每一个位点选择的背后都会有相关的学术文献报道。这里面普通的老百姓是不具备理解这些学术文献需要的专业知识。这个过程和普通人去医院看病类似,病人需要的是治病,相信的是医生的专业知识,基因检测在病人和医生眼里都是一种体检手段,最终的目的是辅助医生完成对病人患病的确诊。这个需求孵化出诊断类的基因检测产品。作为医疗诊断产品,必须受到FDA(在国内对应的部门是CFDA)的监管。所以说最后“测几遍”还是医生说了算。


作为医疗诊断产品,必须受到FDA(在国内对应的部门是CFDA)的监管

那么预防类的基因检测呢?(小编关于诊断类和预防类的基因检测做过详细的分析,读者可以参考小编另一个原创系列《基因检测能成为必需品吗?》)

美国谷歌旗下的23andme公司在健康领域的基因检测产品经过十年的坚持已经成为了基因检测行业的领头羊。该公司在2014年11月被FDA叫停其预防类的基因检测产品服务以后,幸运地融到了5000万美金继续支持其不盈利的基因检测服务。互联网巨头进入基因行业已经是一个不争的事实,国内互联网三大巨头BAT还没有像谷歌那样的眼光和勇气进入基因行业,一方面是国内基因行业的创业公司正在萌芽阶段,而且医疗健康的“水太深”,另一方面国内互联网巨头能争夺的蓝海领域还很多,暂时无暇顾及前景还不明朗的基因行业。但是长期来看,这块“蛋糕”还是很吸引资本的,引用电影里的一句话来形容目前这些互联网巨头们的心态:“让子弹先飞一会吧”。

“读万遍”背后的商业机密

“读万遍”有一个很重要的前提:谁来埋单?


药明康德“读万遍”的潜台词是用户会选择全基因组测序技术“测一遍”完成所有的数据采集,这里面的商业模式有那么简单吗?下面我抛出几个问题和读者们一起分析。

问题一:需要“读万遍”的是谁?

要消费者产生“读万遍”的需求,不是一件容易的事情。每“读一遍”的背后,需要证明其可靠性和准确性。在服务消费者领域如此,何况是健康医疗领域!

23andMe为了满足FDA的要求付出的代价是极高的

美国23andMe最近得到FDA的批准重新开始服务消费者,仅仅是几百项基因检测中的一项:布卢姆综合症基因检测(一种隐形遗传病)。23andMe为了通过FDA的获准为消费者提供产品和服务,付出的代价是对上千名用户进行了非常复杂的标准化学术研究。

仅针对布卢姆综合症这一项,就包括了175名实验室检测证明,302名样本试验和667名随机试验,当然这一切都必须在FDA标准化流程和监管下进行的,前期的资金投入毫无疑问是企业来承担。

由此看来,“读一遍”需要企业付出的代价是巨大的,需要实现“读万遍”的药明康德,的确还有很长的道路要走。

问题二:谁来承载“读万遍”的工作?

不管是“测”还是“读”都需要设备和人力的投入。在“读万遍”的商业模式背后,是对数据分析和解读行业的需求。相比之下我们已经把测序大部分的工作交给了设备,基因数据的产出也实现了标准化和自动化。数据分析的过程中也朝着标准化和自动化发展,但是数据的解读还基本上停留在人工操作的层面。


基因数据的产出基本上实现了标准化和自动化

解读包括数据的注释和解析。基因数据的注释通过机器学习算法和生物信息工程师能实现半自动化。但是数据的解析还需要大量遗传信息咨询师和有基因组学背景的医师,这部分需要国家监管和授予一定的咨询认可证和行医资质。

能承载“读万遍”工作的,需要有专业基因背景知识的信息工程师、咨询师和医师。

问题三:如何解决“读万遍”的数据授权?

小编经常被投资人问到“生物银行”中数据的安全性问题。国家构建“生物银行”的决心也越来越坚定。这里有一个很重要的概念,“生物银行”通常是指生物样本库,存储的是组织、血液、细胞、DNA等生物样本和与其相关的临床资料,还包括对应的质量控制信息管理及应用系统。


“读万遍”的数据并不在“生物银行”里面

从这个层面上理解,可知“读万遍”的数据并不在“生物银行”里面。而“基因银行”的概念目前还是在“云端”无法落地。我们需要的基因数据是无法通过“测一遍”就能够解决的(这一观点以后会慢慢和读者分享)。各大基因检测公司存储的基因数据也是无法对接和共享的。这些数据的所有权归根结底是属于消费者的,至于基因数据的使用权,各家基因检测公司和消费者之间对数据的使用协议都不尽相同。

不管通过任何方式,数据的使用授权一定是存在的,目前国内外也没有相对完善的法律进行规范,小编估计这里会出现一些第三方的企业对基因数据的授权进行管理,消费者能够授权这些第三方机构从基因公司将其基因数据安全地转移出来,进一步交给专业化的生物信息公司和相关的健康医疗机构管理的健康数据进行对接。

问题四:如何保证“读万遍”的数据不被滥用?

前面提到的专业化管理基因数据的生物信息公司,需要相对的独立和规范,最好在国家相关部门的监管下面对基因数据进行操作和挖掘。互联网行业的公司也许能推动这个过程的实现,通过云端的数据存储、分析、解读、应用对接,基本上能够让消费者通过移动互联网技术来管理自己的基因数据。


云端的数据存储、分析、解读、应用对接需要解决安全性问题

让消费者参与到自己基因数据的管理和应用上面,每一步的操作需要的数据授权都能让用户有知情权,通过可视化技术实现用户和数据挖掘的互动。这样的用户体验会让消费者和基因公司之间产生更大的信任感,数据“滥用”的问题也会在规范化的使用协议下面得到解决。

问题五:国家如何来监管“读万遍”?

云计算的发展和基因数据的授权使用也会出现交集。如无意外,基因数据作为伴随人类一生的遗传信息,会被划分为保密等级极高的个人隐私数据,云计算承载了基因数据的应用和挖掘任务,这背后潜在的风险是极高的,不亚于个人的银行账号密码。小编预测,国家相关部门对云主机和云计算会颁发相应的牌照或资质来规范基因数据的存储、分析、解读和挖掘。

结束语

既然“测一遍”是不够的,那么“读万遍”就不止了。从基因检测的临床应用来看,每一项检测服务的数据是需要形成规模效益的,因为这里反映的是一个统计学概率指标。前期对每一项检测服务都需要资金投入,美国奥巴马通过竖起“精准医疗”的大旗把这部分投入转嫁到了“百万基因组计划”里面,英国则通过“十万基因组计划”把前期投入让国家埋单了。到目前为止,中国政府还没有提出任何受到世界瞩目的大规模全基因组测序计划,相信这里还有很长一段道路要走。

前期的大数据积累不到位,“读万遍”的时代不会开始。这不仅仅是一个“先有蛋再有鸡”的问题,而且还是一个医疗健康行业开始数据化的瓶颈。“测一遍、读万遍”的商业机密也隐藏在这个“大数据”里面,只有懂得消费者人性和痛点的聪明人,才能把这个机密抓住变成商机。

E药脸谱网
分享:
最新评论
精彩评论
暂无评论
提交
查询好友:
注:选择好友后只会分享给指定好友,不选择则分享到本站。