当前位置:首页 > 站长资讯 > 正文内容

“深度思维”推出“阿尔法基因组”——人工智能揭秘DNA中的“暗物质”

a811625537个月前 (07-01)站长资讯4

图片来源:《自然》网站

  【科技创新世界潮】(413)

  ◎本报记者 张佳欣

  2003年,科学家首次对人类基因组进行测序,揭示了构成我们生命“蓝图”的全部DNA序列。尽管98%的基因组不直接编码蛋白质,它们仍深刻影响着基因的调控和细胞功能。这些非编码区域曾被视为“垃圾DNA”,但如今被认为可能蕴藏着重要的生物学秘密,就像是基因界的“暗物质”。

  今年6月25日,“深度思维”公司宣布,他们开发出一款名为AlphaGenome(阿尔法基因组)的人工智能(AI)模型,有望在破译这一“暗物质”上取得突破。《自然》杂志报道称,这一“从序列到功能”的模型能预测DNA中微小变化会对一系列分子过程产生的影响,为解码人类基因调控机制提供了新路径。

  解释DNA序列的“一体化”工具

  深度思维公司在2020年推出的“阿尔法折叠2”(AlphaFold2),成功破解了一个困扰科学界数十年的难题:如何根据蛋白质的氨基酸序列,准确预测其三维结构。这一突破不仅改变了结构生物学研究方式,也推动了新药研发的进程。

  相比之下,要理解DNA序列的功能则更加复杂,因为它不像蛋白质那样拥有一个确定的“正确答案”。这些功能主要体现在DNA对基因表达的调控上,比如决定基因什么时候开启或关闭,在哪些细胞中发挥作用,以及以何种强度表达。

  如果说蛋白质结构预测是在拼出“零件”的立体模型,那么DNA功能预测就是要理解说明书中每一个符号、注释、开关命令甚至“暗物质”区域的真正含义。其中涉及的信息层级更复杂、关联更广泛,且同一个DNA片段可能在不同时间、不同细胞类型中扮演不同角色,因此建模难度远高于蛋白质。

  几十年来,生物学家尝试用各种计算工具来揭示DNA复杂而隐秘的调控机制,但这些模型往往聚焦于单一功能。科学家们渴望一种用于解释DNA序列的“一体化”工具,于是,“阿尔法基因组”应运而生。

  据美国趣味工程网站报道称,与以往需在“序列长度”与“预测精度”之间取舍的模型不同,“阿尔法基因组”实现了二者兼得。它既能捕捉长程基因组上下文信息,又能提供碱基层面的精准预测,拓展了疾病生物学、罕见变异研究、合成DNA设计等领域的研究视野。

  一次可处理百万个碱基对

  据深度思维官网介绍,该模型一次可处理多达100万个碱基对,并预测数千种分子属性,包括基因表达、剪接模式、蛋白质结合位点和染色质可及性,覆盖多种不同类型的细胞。这是首次有AI系统能联合建模如此广泛的调控特征。

  “阿尔法基因组”训练所用的数据集来自多个公开的超大规模数据资源。令人惊讶的是,训练一个完整模型仅需4小时,且所需计算资源仅为前代模型的一半。在26项基准测试中,其有24项表现优于或持平于专用模型。

  新模型的一大亮点是其变异评分系统,能高效对比突变前后的DNA序列,并跨多种生物通路评估其影响。

  “阿尔法基因组”还具备剪接位点建模功能,这是首次有模型能够预测与囊性纤维化、脊髓性肌萎缩等疾病相关的RNA剪接异常。

  在合成生物学领域,“阿尔法基因组”可用于设计特定的调控序列,例如仅在神经细胞中激活某些基因,而在肌肉细胞中保持沉默。同时,它也有望用于研究生物效应强烈的罕见遗传变异,如导致孟德尔遗传病的突变。

  在一项验证中,研究人员将“阿尔法基因组”应用于先前研究中识别出的某种白血病相关突变。结果,该模型准确预测出,某些非编码区变异会间接激活附近的TAL1致癌基因,这一机制正是T细胞急性淋巴细胞白血病中已知的致病过程。

  模型尚不适用于个体诊断

  尽管“阿尔法基因组”的表现令人瞩目,但深度思维团队表示,该系统目前仍存在很多限制。它并未设计用于个体基因组解读,也无法像23andMe或临床基因检测那样预测疾病风险或祖源信息。也就是说,该模型不适用于个体诊断或医疗决策。

  “阿尔法基因组”目前的训练数据仅限于人类和小鼠,尚未覆盖其他物种,其跨物种适应性尚待验证。同时,它在识别调控元件与远距离靶基因(距离超过10万个碱基)之间关系方面的能力仍较弱,也无法完全建模细胞在不同状态、不同组织中的动态调控机制。

  美国冷泉港实验室计算生物学家彼得·库指出:“这些模型往往是在一个固定条件下训练的,但现实中的细胞是动态的,蛋白质水平、DNA化学修饰、转录状态等都会随时间和环境变化,这些变化会显著影响同一段DNA序列的行为。”因此,未来模型需要引入更多“多模态”“多时间尺度”因素,才能更真实地模拟生物过程。

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://2345hao.cn/blog/index.php/post/33177.html

分享给朋友:

““深度思维”推出“阿尔法基因组”——人工智能揭秘DNA中的“暗物质”” 的相关文章

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

  1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。   但是现代信息社会并不能避不开国与国之间的问题。   “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

  威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。   2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。   但这对投资者而言,可能并不是一件好事。   由于身在传统电力行业,科研步伐又...

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

  钱流不进口袋的企业,真的算是赚钱企业吗?   盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。   没有现金流入的盈利只是纸面数字,纸面数...

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

  以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。   2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

  历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。   作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...