当前位置:网站首页>AI越进化越跟人类大脑像!Meta找到了机器的“前额叶皮层”,AI学者和神经科学家都惊了...
AI越进化越跟人类大脑像!Meta找到了机器的“前额叶皮层”,AI学者和神经科学家都惊了...
2022-06-25 03:32:00 【QbitAl】
鱼羊 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
说出来你可能不信,有一只AI刚刚被证明,处理语音的方式跟大脑谜之相似。
甚至在结构上都能相互对应——
科学家们在AI身上直接定位出了“视觉皮层”。

这项来自Meta AI等机构的研究一经po出,立马在社交媒体上炸开了锅。一大波神经科学家和AI研究者前往围观。

LeCun称赞这是“出色的工作”:自监督Transformer分层活动与人类听觉皮层活动之间,确实密切相关。

还有网友趁机调侃:Sorry马库斯,但AGI真的快要来了。

不过,研究也引发了一些学者的好奇。
例如麦吉尔大学神经科学博士Patrick Mineault提出疑问:
我们发表在NeurIPS的一篇论文中,也尝试过将fMRI数据和模型联系起来,但当时并不觉得这俩有啥关系。

所以,这到底是一项怎样的研究,它又是如何得出“这只AI干起活来像大脑”的结论的?
AI学会像人脑一样工作
简单来说,在这项研究中,研究人员聚焦语音处理问题,将自监督模型Wav2Vec 2.0同412名志愿者的大脑活动进行了比较。
这412名志愿者中,有351人说英语,28人说法语,33人说中文。研究人员给他们听了大约1个小时的有声书,并在此过程中用fMRI对他们的大脑活动进行了记录。

模型这边,研究人员则用超过600小时的无标签语音来训练Wav2Vec 2.0。
对应志愿者的母语,模型也分为英语、法语、中文三款,另外还有一款是用非语音声学场景数据集训练的。
而后这些模型也听了听志愿者同款有声书。研究人员从中提取出了模型的激活。
相关性的评价标准,遵照这个公式:

其中,X为模型激活,Y为人类大脑活动,W为标准编码模型。

从结果来看,自监督学习确实让Wav2Vec 2.0产生了类似大脑的语音表征。
从上图中可以看到,在初级和次级听觉皮层,AI明显预测到了几乎所有皮层区域的大脑活动。
研究人员还进一步发现了AI的“听觉皮层”、“前额叶皮层”到底长在哪一层。

图中显示,听觉皮层与Transformer的第一层(蓝色)最吻合,而前额叶皮层则与Transformer的最深一层(红色)最吻合。
此外,研究人员量化分析了人类感知母语和非母语音素的能力差异,并与Wav2Vec 2.0模型进行对比。
他们发现,AI也像人类一样,对“母语”有更强的辨别能力,比如,法语模型就比英语模型更容易感知来自法语的刺激。
上述结果证明了,600小时的自监督学习,就足以让Wav2Vec 2.0学习到语言的特定表征——这与婴儿在学说话的过程中接触到的“数据量”相当。

要知道,之前DeepSpeech2论文认为,至少需要10000小时的语音数据(还得是标记的那种),才能构建一套不错的语音转文字(STT)系统。

再次引发神经科学和AI界讨论
对于这项研究,有学者认为,它确实做出了一些新突破。
例如,来自谷歌大脑的Jesse Engel称,这项研究将可视化滤波器提升到了一个新的层次。
现在,不仅能看到它们在“像素空间”里长啥样,连它们在“类脑空间”中的模样也能模拟出来了:

又例如,前MILA和谷歌研究员Joseph Viviano认为,这个研究还证明了fMRI中的静息态(resting-state)成像数据是有意义的。

但在一片讨论中,也出现了一些质疑的声音。
例如,神经科学博士Patrick Mineault除了指出自己做过相似研究但没得出结论外,也给出了自己的一些质疑。

他认为,这篇研究并没有真正证明它测量的是“语音处理”的过程。
相比于人说话的速度,fMRI测量信号的速度其实非常慢,因此贸然得出“Wav2vec 2.0学习到了大脑的行为”的结论是不科学的。
当然,Patrick Mineault表示自己并非否认研究的观点,他自己也是“作者的粉丝之一”,但这项研究应该给出一些更有说服力的数据。
此外也有网友认为,Wav2vec和人类大脑的输入也不尽相同,一个是经过处理后的波形,但另一个则是原始波形。

对此,作者之一、Meta AI研究员Jean-Rémi King总结:
模拟人类水平的智能,确实还有很长的路要走。但至少现在来看,我们或许走在了一条正确的道路上。

你认为呢?
论文地址:
https://arxiv.org/abs/2206.01685
参考链接:
[1]https://twitter.com/patrickmineault/status/1533888345683767297
[2]https://twitter.com/JeanRemiKing/status/1533720262344073218
[3]https://www.reddit.com/r/singularity/comments/v6bqx8/toward_a_realistic_model_of_speech_processing_in/
[4]https://twitter.com/ylecun/status/1533792866232934400
边栏推荐
- C语言数组与结构体指针
- Apple's legendary design team disbanded after jobs refused to obey cook
- MySQL installation tutorial
- 大咖说*计算讲谈社|如何提出关键问题?
- Is it safe to open an online stock account?
- Gold medal scheme of kaggle patent matching competition post competition summary
- When people look at the industrial Internet from the Internet like thinking and perspective, they have actually fallen into a dead end
- 用指南针开户如何选择证券公司?哪一个是更安全的
- 1-6 build win7 virtual machine environment
- Solution of separating matlab main window and editor window into two interfaces
猜你喜欢

Solution of separating matlab main window and editor window into two interfaces

The era of copilot free is over! Student party and defenders of popular open source projects can prostitute for nothing

Difference between left join on and join on

西电AI专业排名超清北,南大蝉联全国第一 | 2022软科中国大学专业排名

Background page production 01 production of IVX low code sign in system

小米路由R4A千兆版安装breed+OpenWRT教程(全脚本无需硬改)

好用的字典-defaultdict

保险也能拼购?个人可以凑够人数组团购买医疗保险的4大风险

CVPR大会现场纪念孙剑博士,最佳学生论文授予同济阿里,李飞飞获黄煦涛纪念奖...

DSPACE设置斑马线和道路箭头
随机推荐
AI自己写代码让智能体进化!OpenAI的大模型有“人类思想”那味了
Easy to use dictionary -defaultdict
[FPGA] serial port controls temperature acquisition by command
在Microsoft Exchange Server 2007中安装SSL证书的教程
Self cultivation and learning encouragement
力扣每日一题-第26天-506.相对名次
14 BS object Node name Name attrs string get node name attribute content
DateTimeFormat放到@RequestBody下是无效的
Seata四大模式之TCC模式详解及代码实现
騰訊開源項目「應龍」成Apache頂級項目:前身長期服務微信支付,能hold住百萬億級數據流處理...
单例的饥饿、懒汉模式案例
20年ICPC澳门站L - Random Permutation
怎么开户打新债 开户是安全的吗
指南针在上面开户安全吗?靠谱吗?
给你讲懂 MVCC 续篇
Before the age of 36, Amazon transgender hackers were sentenced to 20 years' imprisonment for stealing data from more than 100million people!
Overview of AOSP ~ WiFi architecture
Rebeco:使用机器学习预测股票崩盘风险
36岁前亚马逊变性黑客,窃取超1亿人数据被判20年监禁!
Error log format and precautions