当前位置:网站首页>YaLM 100B:来自俄罗斯Yandex的1000亿参数开源大模型,允许商业用途
YaLM 100B:来自俄罗斯Yandex的1000亿参数开源大模型,允许商业用途
2022-06-27 01:48:00 【智源社区】
GitHub地址: https://github.com/yandex/YaLM-100B (才发布几天,已经有2400颗星了)
Yandex是俄罗斯搜索巨头,官方博客中这样介绍:
一年多来,我们一直在 Alice 语音助手和 Yandex 搜索中使用 YaLM 系列语言模型。 今天,我们将开源最大的 YaLM 模型,有1000亿个参数。我们花了 65 天的时间在 800 个 A100 显卡上和 1.7 TB 在线文本、书籍和无数其他资源上训练这一模型。我们在 GitHub 上发布了模型和有用的材料,采用 Apache 2.0 许可,允许研究和商业用途。它是目前世界上最大的可自由使用的英语 GPT 类神经网络。
博客中还非常良心地介绍了模型训练加速的很多经验,包括如何寻找瓶颈、使用快速数据类型、加速GPU上的操作、减少内存访问、禁用Dropout、通信、ZeRO优化器等等,推荐阅读。
边栏推荐
猜你喜欢
随机推荐
Oracle/PLSQL: Lower Function
memcached基礎12
d的appendTo包装
uvm中的config机制方法总结(二)
NLP: brief introduction of transformer in NLP natural language field (pre training technology), NLP model development (elmo/gpt/bert/mt-dnn/xlnet/roberta/albert), detailed introduction to classic case
按键控制LED状态翻转
福元医药上市在即:募资净额将达到16亿元,胡柏藩为实际控制人
Oracle/PLSQL: HexToRaw Function
Systematic analysis of social networks using Networkx: Facebook network analysis case
Oracle/PLSQL: NumToYMInterval Function
Oracle/PLSQL: From_ Tz function
Markdown table (consolidated)
Sample development of WiFi IOT Hongmeng development kit
WiFi-IoT 鸿蒙开发套件样例开发
Oracle/PLSQL: VSize Function
dat.gui.js星星圆圈轨迹动画js特效
Oracle/PLSQL: Upper Function
Online text digit recognition list summation tool
Reading a book in idea is too much!
getReader() has already been called for this request








