站长之家(ChinaZ.com) 5月4日 消息:德克萨斯大学奥斯汀分校的研究人员ChatGPT 的生成式预训练 Transformer (GPT) AI 模型,从功能性 MRI (fMRI) 记录中重建人类思想,准确率高达82%,从而取得了突破性发现。
研究与方法论
德克萨斯大学奥斯汀分校的研究人员发表在《自然神经科学》 (Nature Neuroscience) 上,他们使用功能磁共振成像 (fMRI) 收集了三个人类受试者在听叙事故事时的16小时大脑记录。该团队分析了这些录音,以确定与单个单词相对应的特定神经刺激。
(资料图)
由于 fMRI 的空间分辨率高但时间分辨率低,从非侵入性记录中解码单词长期以来一直是一个挑战。尽管 fMRI 图像质量很高,但一个想法可以在大脑信号中持续长达10秒,导致记录捕捉到以典型速度说出的大约20个英语单词的组合信号。
在 GPT 大型语言模型 (LLM) 出现之前,这项任务对于科学家来说几乎是不可逾越的。非侵入性技术只能识别人类受试者正在思考的几个特定词。然而,通过使用定制训练的 GPT LLM,研究人员成功地创建了一个强大的连续解码工具,因为要解码的单词远远多于可用的大脑图像——这正是 LLM 具有超能力的地方。
GPT 模型从感知的语音、想象的语音甚至无声视频中生成可理解的单词序列,并且非常准确:
感知语音(受试者听录音):72–82% 的解码准确度。
想象中的演讲(受试者在心里讲述一个一分钟的故事):41-74% 的准确率。
无声电影(受试者观看无声的 Pixar 电影剪辑):解码受试者对电影的解释的准确率为21–45%。
人工智能模型可以破译刺激的含义和受试者想到的特定词语,从“躺在地板上”到“别管我”和“尖叫和哭泣”等短语。
研究人员称这种从非侵入性信号中解码人类思想的前所未有的准确性为无数的科学机会和潜在的未来应用铺平了道路。
然而,解码人类思想的前景引发了关于精神隐私的问题,必须制定政策来保护每个人的精神隐私。GPT 模型从感知的语音、想象的语音甚至无声视频中生成可理解的单词序列,并且非常准确。
研究人员承认,未来的解码器可能会克服局限性,不准确的解码器预测可能会被滥用于恶意目的。
论文地址:点此访问
(举报)
标签: