当前位置：网站首页>【AI4Code最终章】AlphaCode：《Competition-Level Code Generation with AlphaCode》（DeepMind）

【AI4Code最终章】AlphaCode：《Competition-Level Code Generation with AlphaCode》（DeepMind）

2022-07-25 11:11:00 【chad_lee】

在这里插入图片描述

14位共同一作，74页论文。

认为CodeX只是做了一个简单的自然语言-程序语言的翻译任务，AlphaCode要做一个更难的。输入输出为：

在这里插入图片描述

模型训练分为预训练和微调，然后预测阶段先大规模采样（召回）得到一百万，然后聚类和过滤得到1000个（粗排），然后选出10个提交（精排）。

在这里插入图片描述

先在Github收集开源代码，经过预处理和清洗后715GB，作为预训练数据集；然后用CodeContests 数据集微调，格式如上图。

在这里插入图片描述

没有模型图。不同于CodeX的GPT，只用Transformer的decoder，这里用的是完整的Transformer，既有encoder也有decoder。最小模型3亿参数，最大模型4000亿参数。

这里值得多说一点的是这里的multi-head attention只有多个query，KV都是同一个。

encoder输入是题目的描述（也包括：题目的tags、solution使用的语言、题目中的样例），decoder的输出对应的ground-truth是一个solution，可以是对的，也可以是错的。

在这里插入图片描述

Step1: 将题目描述输入到模型1，从模型1中采样出100万个输出代码。
Step2: 显然采样出的这100万个代码中99%都是不能运行的、错误的代码，用题目中自带的test case，先过滤掉这些无效、错误代码，仍然剩下1000个可以运行的代码。（召回：百万～千）
Step3: AlphaCode引入一个额外模型2，模型2也是用的模型1的预训练模型，但是fine-tuning的目的是输入题目描述，输出test case。模型2自动生成的test case并不保证准确性，只是为了接下来聚类用的。模型2为当前问题生成了50个 test inputs。
Step4: 将生成的50个 test inputs分别输入到 1000个代码中，如果一些代码的生成结果近乎一样，说明这些代码背后的算法或逻辑相似，可被归为一类。经过聚类之后，留下10类代码，先从数目较大的类中选出代码去提交，更有胜算。（精排：千～10）