所有文章 > 正文

DeepEC深度学习计算框架实现对酶编号的高精准预测

作者: Jansfer

时间: 2019-07-12 20:26

研究人员现已证明,深度学习驱动的计算框架“DeepEC”能够实现酶编号数值的高质量和高通量预测,这对于准确理解酶的功能至关重要。

图|DeepEC的总方案(图片来源: KAIST)

由Jae Yong Ryu博士、Hyun Uk Kim教授和KAIST(韩国科学技术院)的杰出教授Sang Yup Lee报告了该深度学习的计算框架DeepEC,其以高吞吐量方式高精度地预测了酶编号(EC)。

酶是催化生物化学反应的蛋白质,EC编号由四个号码(即a,b,c,d)组成,分别表示不同的生物化学反应。EC编号的鉴定对于准确理解酶功能和代谢至关重要。

EC编号通常在基因组注释程序期间给予编码酶的蛋白质序列。由于EC编号的重要性,已经开发了几种EC编号预测工具,但是它们在计算时间、精度、覆盖范围以及EC编号预测所需的文件总大小方面还有待进一步改进。

DeepEC使用三个卷积神经网络(CNN,深度学习的代表算法之一)作为预测EC编号的主要引擎,并且如果三个CNN不能为给定的蛋白质序列产生可靠的EC编号,就还进行EC编号的同源性分析。DeepEC是通过使用涵盖1,388,606个蛋白质序列和4,669个EC编号的金标准数据集开发的。

最显著的是,通过DeepEC和其他五个具有代表性的EC数值预测工具的基准研究表明,DeepEC对EC编号的预测是最精确且最快速的。但是DeepEC还需要更小的磁盘空间,这样才能成为理想的第三方软件组件。

此外,由于蛋白质序列的结构域/结合位点残基的突变,DeepEC在检测酶功能丧失方面最敏为灵敏。在该比较分析中,所有结构域或结合位点残基被L-丙氨酸残基取代以除去蛋白质功能,被称为L-丙氨酸扫描法。

该研究于2019年6月20日发表在美国国家科学院院刊(PNAS)上,题为“深度学习能够实现酶编号的高质量和高通量预测”(Deep learning enables high-quality and high-throughput prediction of enzyme commission numbers)。

Kim教授表示,DeepEC可以作为一个独立的工具,也可以作为第三方软件组件与其他检测代谢反应的计算平台结合使用。而且DeepEC可以在网上免费下载。 同时Lee教授也补充说,通过DeepEC,可以更有高效、更准确地处理不断增加的蛋白质序列数据。

参考:https://phys.org/news/

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多