想象一下,如果人工智能(AI)能讀出人腦中正在想的事,你敢信嗎?
向研究對象展示的豹子圖像(左)以及通過(guò)生成式AI利用大腦活動(dòng)重建的圖像(右)。
圖片來(lái)源:日本量子科學(xué)技術(shù)研究所
本月在線(xiàn)發(fā)表在國際科學(xué)雜志《神經(jīng)網(wǎng)絡(luò )》上的一項研究顯示,日本科學(xué)家利用AI技術(shù),成功地根據人腦活動(dòng)創(chuàng )建了世界上第一幅物體和風(fēng)景的心理圖像。這項被稱(chēng)為“大腦解碼”的技術(shù)可以根據大腦活動(dòng)將感知內容可視化,有望應用于醫療和福利領(lǐng)域。
在腦機接口和神經(jīng)工程快速發(fā)展的今天,通過(guò)分析大腦活動(dòng),用機器讀出志愿者大腦中所想的內容或者畫(huà)面已經(jīng)不再是科幻故事。解碼思想的技術(shù)日趨成熟,AI“讀心術(shù)”的設想越來(lái)越接近現實(shí)。與此同時(shí),這也引發(fā)了人們對隱私的憂(yōu)慮。
復制心理意象
先前的研究表明,根據功能磁共振成像(fMRI)測量的大腦活動(dòng)可重建人類(lèi)看到的圖像。但這僅限于特定內容,例如字母、人臉等。
基于之前的方法,日本量子科學(xué)技術(shù)研究所(QST)和大阪大學(xué)科學(xué)家團隊開(kāi)發(fā)了一種技術(shù),可量化大腦活動(dòng),并將生成式AI和預測技術(shù)結合來(lái)繪制圖像,以重建復雜的物體。
研究人員向參與者展示了大約1200張物體和風(fēng)景圖像,并使用fMRI分析和量化了他們的大腦信號和視覺(jué)刺激之間的關(guān)系,然后將這些圖像用于訓練生成式AI,以破譯和復制來(lái)自大腦活動(dòng)的心理意象。結果,研究人員利用這種方法產(chǎn)生了生動(dòng)的圖像,例如具有耳朵、嘴巴和斑點(diǎn)等可辨別特征的豹子,以及帶有紅色翼燈的飛機等物體。
研究人員表示,將心理圖像可視化為任意的自然圖像是一個(gè)重要的里程碑。
QST研究人員稱(chēng),人類(lèi)已使用顯微鏡和其他設備來(lái)觀(guān)察肉眼看不見(jiàn)的世界,但還無(wú)法看到一個(gè)人的內心世界,這是人類(lèi)第一次窺視另一個(gè)人頭腦中的思想。從本質(zhì)上講,它可用來(lái)幫助創(chuàng )建新的通信設備,同時(shí)還可讓科學(xué)家探索和理解幻覺(jué)與夢(mèng)境如何在大腦中發(fā)揮作用。
解碼語(yǔ)言數據
《自然·神經(jīng)科學(xué)》雜志今年稍早時(shí)間發(fā)表了一項新研究。美國得克薩斯大學(xué)奧斯汀分校研究團隊在大型語(yǔ)言模型的助力下,開(kāi)發(fā)出一款現代“讀心機”。他們利用fMRI收集了3名參與者的大腦活動(dòng)信息,并將思維轉化為了語(yǔ)言文字,準確率達到82%。
fMRI掃描的血氧水平依賴(lài)性信號顯示了大腦不同部位的血流量和氧合水平的變化。通過(guò)關(guān)注處理語(yǔ)言的大腦區域和網(wǎng)絡(luò )的活動(dòng)模式,研究人員發(fā)現他們的解碼器可被訓練來(lái)重建連續語(yǔ)言,包括一些特定的單詞和句子的一般含義。
具體而言,解碼器獲取了3名參與者聽(tīng)故事時(shí)的大腦反應,并生成了可能產(chǎn)生這些大腦反應的單詞序列。這些單詞序列很好地捕捉了故事的大意,甚至還包括準確的單詞和短語(yǔ)。研究人員還讓參與者觀(guān)看無(wú)聲電影并在掃描大腦時(shí)想象電影情節。在這兩種情況下,解碼器通常都能成功預測故事和情節的要點(diǎn)。例如,一位用戶(hù)認為“我還沒(méi)有駕照”,解碼器預測“她還沒(méi)開(kāi)始學(xué)開(kāi)車(chē)”。此外,當參與者主動(dòng)聆聽(tīng)一個(gè)故事而忽略同時(shí)播放的另一個(gè)故事時(shí),解碼器可識別正在主動(dòng)聆聽(tīng)的故事的含義。
讀腦技術(shù)引擔憂(yōu)
能夠“讀心”的技術(shù)理念引發(fā)了人們對心理隱私的擔憂(yōu)。西班牙格拉納達大學(xué)生物倫理學(xué)教授戴維·羅德里格斯·阿里亞斯·韋爾恩警告,這更接近機器“能夠讀懂思想并轉錄思想”的未來(lái),但其可能會(huì )違背人們的意愿。
美國醫療新聞網(wǎng)站statnews針對得克薩斯大學(xué)奧斯汀分校的研究發(fā)表評論稱(chēng),人們通常將這類(lèi)大腦解碼器描述為“讀心機”,但這是一個(gè)模糊的術(shù)語(yǔ),夸大了它們的能力。雖然人們的大腦產(chǎn)生了心理過(guò)程,但人們對大多數心理過(guò)程在大腦活動(dòng)中究竟是如何編碼的了解有限。
文章認為,大腦解碼器不能簡(jiǎn)單地讀出一個(gè)人的思想內容。相反,它們學(xué)會(huì )的是對心理內容作出預測。大腦解碼器就像是解釋大腦活動(dòng)模式和精神內容描述之間的一本詞典。然而,大腦活動(dòng)會(huì )受到直接刺激以外的因素的影響,因此“詞典”只能預測一個(gè)人的大腦將如何對刺激作出反應。此外,衡量一個(gè)人的大腦對每一種可能的刺激的反應是不可行的。預測過(guò)程天生就不完美,所以解碼器對一個(gè)人的想法的預測,可能與這個(gè)人的實(shí)際想法有很大出入。
此外,文章強調,大腦解碼器只能“復制”活躍的精神內容。所有的大腦記錄方法都會(huì )測量與人正在積極處理信息時(shí)相對應的信號。相比之下,不活躍的信息,如長(cháng)期記憶,是在神經(jīng)元之間的連接中編碼的,人們距離能夠測量和解碼這些信息還很遠。
相關(guān)稿件