当前位置:网站首页>论文笔记:Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 & appendix)
论文笔记:Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 & appendix)
2022-07-25 16:03:00 【UQI-LIUWJ】
注:这篇Nature的论文,如果光看正文,没法理解,需要结合它的补充材料一起看
同时这篇文章看得太吃力了QAQ,如果有说的不对的地方欢迎指正
0 前言
- 蛋白质结构预测:给定某一个蛋白质的一串氨基酸序列,猜测这个蛋白质的3D结构是什么样子的
- 现在的生物学可能需要很长的时间来具体了解一个蛋白质的结构
- 让蛋白质动起来,从不同的角度用显微镜来看它的结构
- 这篇论文提出了AlphaFold 2
- 前作AlphaFold 1精度不够
- AlphaFold 2的精度可以到达原子级别
- 实验室测得的(真实)位置和预测的位置之间的差距在原子大小的级别以内
- 模型使用了一定的生物学和物理学的知识,融合在深度学习里面
1 模型部分
1.1 整体模型

Transformer部分(也就是这里的encoder)只起到不同元素(氨基酸)之间信息整合的作用,真正信息的提炼部分,是在decoder部分实现的
我对于回收机制的想法:
这个机制有一点类似RNN中把hidden state再传给下一轮的RNN。通过不断地利用上一轮学到的输出,来获得更好的输出结果(每一轮的输出可能精度有限,通过不断迭代获得更好的效果)
区别在于,这里只重用结构,但是不回传梯度。(就是说传回去的几个输出是detach了的输出)
——>和RNN重用结构相比,虽然计算时间上没有区别,但是内存上是有区别的(RNN的话,“回传”的hidden state的梯度也是需要记录在内存中的,但是这边回传的输出是不用记录梯度的)
1.2 “encoder”部分
1.2.1 整体模型

1.2.2 row-wise gated self-attention with pair bias


1.2.3 column-wise gated self-attention
大体流程和1.2.2 类似,区别在于,这里是按列来进行self-attention(同一个位置的氨基酸在不同蛋白质之中的权重)


1.2.4 MSA transition
(两个transition是一样的)
这个就是一个MLP


1.2.5 Outer product mean
1.2.6 Triangular multiplicative update

类似的,只是变成出边

注意:由于出边入边模块的先后问题,所以得到的矩阵不一定对称。
1.2.7 Triangular self-attention
上图是之前的按行attention,下图是这里的attention,可以看到是很类似的

伪代码部分也基本一样,不过这里论文的意思是第五行(attention加权的部分)使用了一定的三角性质

1.3 “decoder”部分
1.3.0 如何预测?
- 表达蛋白质3D结构最简单的方法是记录每个元素的3D坐标。
- 蛋白质进行旋转/平移是不影响蛋白质结构的,但是如果用3D坐标的话,绝对位置会发生变化
- ——>所以这里使用的是相对位置
- 蛋白质可以想成主干+支链
- 主干点我们记为x,那么链上面任意一个点/主干的后一个点可以看成y=Rt+x
- 根据3*3的矩阵R做旋转
- 根据x做平移
1.3.1 整体模型

1.3.2 IPA Invariant point attention

1.3.3 Backbone update
更新骨干各点的s和T

实验效果
.1 和其他项目的对比

- 每一列是一个模型(参赛队伍)
- 每一条柱状图是对应的模型,平均预测位置和真实位置的区别(单位是
,即
米,也即原子的大小)
- 可以看到AlphaFold 2的精度已经达到了原子精度,这是一个里程碑意义的精度
2 AlphaFold 预测的精度

- 蓝色的是AlphaFold 预测的结果
- 绿色的是实验室预测出来的结果
- 可以看到他们的误差确实在一个原子的大小(黑色球体)以内
边栏推荐
- 电阻电路的等效变化(Ⅱ)
- 百奥赛图与LiberoThera共同开发全人GPCR抗体药物取得里程碑式进展
- 阿唐的小帮手
- Baseband simulation system experiment of 4pam in Gaussian channel and Rayleigh channel
- 用递归进行数组求和
- 今天睡眠质量记录84分
- Permission management - delete menu (recursive)
- 狂神redis笔记12
- 一文入门Redis
- [IJCAI 2022] parameter efficient large model sparse training method, which greatly reduces the resources required for sparse training
猜你喜欢

Circulaindicator component, which makes the indicator style more diversified
![[server data recovery] data recovery cases of raid information loss caused by unexpected power failure of HP EVA server storage](/img/90/51d86111b918eb60761818110cdec4.jpg)
[server data recovery] data recovery cases of raid information loss caused by unexpected power failure of HP EVA server storage

电阻电路的等效变化(Ⅱ)

面试突击:为什么 TCP 需要 3 次握手?

阿唐的小帮手

ML - Speech - traditional speech model

MATLAB optimization tool manopt installation

一文入门Redis

# JWT 图解

How matlab saves all the data after running
随机推荐
[wechat applet] detailed explanation of applet host environment
Permission management - delete menu (recursive)
mysql 表写锁
乐观锁悲观锁适用场景
基于Caffe ResNet-50网络实现图片分类(仅推理)的实验复现
MySQL tutorial 71-where conditional query data
今天睡眠质量记录84分
Baseband simulation system experiment of 4pam in Gaussian channel and Rayleigh channel
Matlab -- CVX optimization kit installation
Save the image with gaussdb (for redis), and the recommended business can easily reduce the cost by 60%
Ice 100g network card fragment message hash problem
排他锁(EXclusive Lock)
MySQL explicit lock
Release of v6.5.1/2/3 series of versions of Xingyun housekeeper: the ability of database OpenAPI continues to be strengthened
02. 将参数props限制在一个类型的列表中
Wavelet transform --dwt2 and wavedec2
MATLAB optimization tool manopt installation
Data system partition design - partition rebalancing
Circulaindicator component, which makes the indicator style more diversified
【莎士比亚:保持做人的乐趣】


