当前位置:网站首页>俄罗斯AIRI研究院等 | SEMA:利用深度迁移学习进行抗原B细胞构象表征预测
俄罗斯AIRI研究院等 | SEMA:利用深度迁移学习进行抗原B细胞构象表征预测
2022-06-25 03:33:00 【智源社区】
本文筛选了 PDB 数据库以选择与抗体相互作用的抗原表位残基。对于每个抗原残基,计算了contact numbe(接触数)r特征,该特征表示抗原残基与距离半径R 1 内的抗体残基的接触次数。如果与相互作用抗体的距离低于指定的临界值 R 1,则认为抗原残基为表位。R 1 在 4.5、6.0 和 8.0 Å 范围内选择。4.5 Å 的截止值反映了与抗体残基直接相互作用的存在。6.0 Å 和 8.0 Å 的半径值还包括参与长程相互作用的残基。
众所周知,抗原表位可以在空间上分布在抗原结构上,在某些情况下,这些实验信息可能会丢失。考虑到这一点,本文根据与相互作用抗体 R 2的距离将非表位残基拆分为“近距离”( R < R 2) 和“远距离”( R > R2)。本文选择R 2 等于 12.0、14.0 或 16.0 Å 来分析表位边界区域信息对模型准确性的影响。
SARS-CoV-2的S蛋白的RBD结构域是迄今为止在结构上最有特色的抗原之一。本文对RBD结构域而不是全长的S蛋白进行分析,以排除目前SEMA没有考虑的糖基化的假定影响。为了评估SEMA的性能,在模型训练期间,本文排除了S-蛋白的所有同源序列(相同程度>70%),特别是MERS和SARS-CoV的S-蛋白。对SEMA-3D进行了评估,以解决三个问题:(1)正确分配表位和非表位残基;(2)正确预测接触数特征;(3)预测免疫显性表位残基。RBD的免疫优势残基是根据PDB数据库中RBD/抗体复合物的比例来估计的,其中RBD残基与抗体有直接接触。本文假设计算出的比率可以估计出RBD残基的免疫原性,高的比率对应于免疫显性残基。
- 本文生成了一个基准,包括根据两个距离截止值对表位残基进行分类的抗原。第一个距离,R1,定义了正的表位标签类别,而第二个距离,R2,定义了如果残基离表位太远而在度量计算中被忽略。有限的R2半径使得评估该模型预测表位边界的能力成为可能。此外,对于每个抗原残基,本文计算了接触数特征,对应于位于抗原残基半径R1内的抗体原子数。这一特征被引入到模型训练中,为抗体和抗原之间的相互作用提供额外的空间信息。
- 本文展示了一个微调的蛋白质语言模型(ESM-1v)和一个反折叠模型(ESM-IF1)在预测构象表位时表现良好。更具体地说,该模型是在只有783条抗原记录的非冗余集上进行微调的,其表位残基是根据PDB数据库中可用的抗原/抗体结构和选定的R1和R2半径值分配的。
- 本文最终展示了模型SEMA;它包括SEMA-1D(微调的ESM-1v)和SEMA-3D(微调的ESM-IF1)模型,分别用于基于序列和基于结构的构象B细胞表位预测。SEMA在所有基准任务中都取得了很高的指标,并在R1=8.0 Å和R2=16.0 Å的屏蔽数据集中进行了训练。
- 此外,本文表明SEMA可以预测RBD域残基的免疫原性。在这种情况下,本文评估了RBD结构域残基的免疫原性,即在所有可用的RBD/抗体复合物中,相应残基与抗体直接接触的复合物的比率。
边栏推荐
- 华为上诉失败,被禁止在瑞典销售 5G 设备;苹果公司市值重获全球第一;Deno 完成 2100 万美元 A 轮融资|极客头条
- Is it safe to open a stock account with the customer's haircut account link? Tell me what you know
- What if Alipay is controlled by risk for 7 days? Payment solution
- Musk: Twitter should learn from wechat and make 1billion people "live on it" into a super app
- 程序员真人秀又来了!呼兰当主持挑灯狂补知识,SSS大佬本科竟是药学,清华朱军张敏等加入导师团...
- 威马招股书拆解:电动竞争已结束,智能排位赛刚开始
- Performance rendering of dSPACE
- 存算一体芯片离普及还有多远?听听从业者怎么说 | 对撞派 x 后摩智能
- 吴恩达机器学习新课程又来了!旁听免费,小白友好
- Insurance app aging service evaluation analysis 2022 issue 06
猜你喜欢
Before the age of 36, Amazon transgender hackers were sentenced to 20 years' imprisonment for stealing data from more than 100million people!
Tencent's open source project "Yinglong" has become a top-level project of Apache: the former long-term service wechat payment can hold a million billion level of data stream processing
老叶的祝福
Zuckerberg's latest VR prototype is coming. It is necessary to confuse virtual reality with reality
现在,耳朵也要进入元宇宙了
单例的饥饿、懒汉模式案例
ICML 2022 | 字节跳动 AI Lab 提出多模态模型:X-VLM,学习视觉和语言的多粒度对齐...
2点睡10点起不算熬夜?除非你每天都能执行
Internet Explorer died, and netizens started to build a true tombstone
Google founder brin's second marriage broke up: it was revealed that he had filed for divorce from his Chinese wife in January, and his current fortune is $631.4 billion
随机推荐
The era of copilot free is over! Student party and defenders of popular open source projects can prostitute for nothing
[proteus simulation] Arduino uno+ nixie tube display 4X4 keyboard matrix keys
Easynvr fails to use onvif to detect the device. What is the reason why "no data" is displayed?
老叶的祝福
协作+安全+存储,云盒子助力深圳爱德泰重构数据中心
Apple's legendary design team disbanded after jobs refused to obey cook
AI writes its own code to let agents evolve! The big model of openai has the flavor of "human thought"
亚马逊在中国的另一面
Tutorial on installing SSL certificates in Microsoft Exchange Server 2007
Insurance app aging service evaluation analysis 2022 issue 06
Is it reliable for CITIC Securities to open a mobile account? Is it safe?
网上开户股票安全吗?怎么开户呢?
用指南针开户如何选择证券公司?哪一个是更安全的
Maintenant, les oreilles vont entrer dans le métacosme.
Google founder brin's second marriage broke up: it was revealed that he had filed for divorce from his Chinese wife in January, and his current fortune is $631.4 billion
Is it safe to open a stock account with the customer's haircut account link? Tell me what you know
2022年海外电商运营三大关键讲解
中国天眼发现地外文明可疑信号,马斯克称星舰7月开始轨道试飞,网信办:APP不得强制要求用户同意处理个人信息,今日更多大新闻在此...
指南针在上面开户安全吗?靠谱吗?
股票在网上开户安全吗?在线等答案