Scidown文献预览系统!
基于变压器的蛋白功能联合序列标注-标签嵌入( TALE: Transformer-based protein function Annotation with joint sequence-Label Embedding )
Y Cao Y Shen
动机:面对高通量序列数据和有限的功能洞察之间不断增加的差距,计算蛋白质功能注释提供了一种高通量替代实验方法。然而,目前的方法在依赖于序列以外的蛋白质数据的同时,可能具有有限的适用性,或者缺乏对新的序列、物种和功能的概括能力。结果:为了克服上述在适用性和推广性方面的障碍,我们提出了一种仅利用序列信息的蛋白质深度学习模型--基于变压器的蛋白质功能注释通过联合序列标记嵌入(TALE)。为了对新序列的泛化能力,我们使用基于自身注意力的变压器来捕获序列中的全局模式。为了推广到不可见或很少见的函数(尾标签),我们将蛋白质功能标签(有向图上的层次GO项)与输入/特征(一维序列)一起嵌入到一个联合潜在空间中。结合TALE和一种基于序列相似性的方法,TALE+在只有序列输入时表现优于竞争方法。在三个基因本体中的两个方面,它甚至超过了使用序列以外的网络信息的最新方法。此外,与训练数据相比,TALE和TALE+对低相似性、新物种或很少注释功能的蛋白质具有更好的概化能力,揭示了蛋白质序列-功能关系的深刻见解。烧蚀研究阐明了算法部件对精度和概化性的贡献。可用性:数据、源代码和模型可在https://github.com/shen-lab/tale上获得。补充资料:补充数据可在生物信息学在线获得。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】