精品2022露脸国产偷人_亚洲成aV人片在线播放一二区_国产亲子乱XXXXinin_被按在办公室糟蹋小黄文_国产国语对白

NeuroAI:邁向下一代人工智能

軍工資源網(wǎng) 2022年11月30日

在未來幾十年,AI可能會像上世紀發(fā)生的計算機革命一樣以一種深刻的方式改變社會和世界經(jīng)濟,而且速度可能會更快。這場AI革命為人類在現(xiàn)代經(jīng)濟中釋放創(chuàng)造力提供了巨大的機會。人工智能系統(tǒng)的新進展可以使工人獲得更高的生產(chǎn)力,并避免工人從事最危險和最卑微的工作。但是,為了實現(xiàn)這一目標,我們需要使AI獲得類似人類的能力。從歷史上看,神經(jīng)科學(xué)一直是AI進步的關(guān)鍵驅(qū)動力和靈感來源,尤其是人工智能更精通的領(lǐng)域,如視覺、基于獎勵的學(xué)習(xí)、與物理世界的互動以及語言方面等,這些領(lǐng)域人類和動物也很擅長。人工智能依然可以扮演這個角色,但為了加速AI的發(fā)展并實現(xiàn)其巨大潛力,我們必須投資“NeuroAI”的基礎(chǔ)研究。

幾十年前,當時的研究人員為試圖了解大腦是如何計算的而埋下了人工智能的種子。事實上,在上世紀40年代,約翰·馮·諾伊曼利用他所掌握的非常有限的關(guān)于大腦的知識,建立了現(xiàn)代“馮·諾依曼計算機架構(gòu)”,這些有限的知識來源于最初建造人工大腦的嘗試。推動現(xiàn)代人工智能革命的深度卷積神經(jīng)網(wǎng)絡(luò)建立于人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)之上,其直接靈感來源于戴維·赫貝爾(David Hubel)和托爾斯滕·維塞爾(Torsten Wiesel)關(guān)于貓的視覺處理神經(jīng)環(huán)路的工作,后者獲得了諾貝爾獎。與之相似的是強化學(xué)習(xí)(RL)的發(fā)展歷程,RL的直接靈感來源于對動物行為和其神經(jīng)活動的觀察。幾十年后的今天,人工神經(jīng)網(wǎng)絡(luò)和RL的應(yīng)用發(fā)展迅速,以至于很多觀察者都認為人工智能的長期目標——通用人工智能已經(jīng)實現(xiàn)了。然而,領(lǐng)域內(nèi)的人士則認為,在我們建立類似人類,甚至小鼠這樣的人工智能系統(tǒng)之前,我們?nèi)孕柙谶@個領(lǐng)域取得新的突破,因為現(xiàn)有的人工智能系統(tǒng)尚不能完成類似小鼠的所有任務(wù)。

盡管人工智能系統(tǒng)可以在國際象棋和圍棋等游戲中輕松擊敗任何人類對手,但它們魯棒性很差,在面對新環(huán)境的時候往往會失效。此外,我們還沒有建立能夠走到貨架邊、取下棋盤、放置棋子、在游戲中移動棋子的系統(tǒng)。類似地,沒有機器可以筑巢、覓食漿果或照顧幼崽。今天的人工智能系統(tǒng)無法與四歲兒童甚至簡單動物的感覺運動能力競爭。許多應(yīng)對新情況所需的基本能力對人工智能來說具有較大的挑戰(zhàn),但動物天生就擁有或可輕松獲得這些能力,部分原因是人工智能系統(tǒng)缺乏與變幻世界互動的基本能力。越來越多的人工智能研究人員懷疑,僅僅擴大現(xiàn)有方法就能克服這些限制??紤]到需要在AI中實現(xiàn)更多的自然智能,很可能需要從自然智能系統(tǒng)中獲得新的靈感。

雖然許多關(guān)鍵的人工智能進步,如卷積人工神經(jīng)網(wǎng)絡(luò)和RL,都受到了神經(jīng)科學(xué)的啟發(fā),但目前機器學(xué)習(xí)領(lǐng)域的許多研究都在遵循自己的道路,建立在之前開發(fā)的方法基礎(chǔ)上,這些方法是受數(shù)十年來神經(jīng)科學(xué)的發(fā)現(xiàn)而啟發(fā)的,例如,受到大腦中注意力機制啟發(fā)的基于注意力的神經(jīng)網(wǎng)絡(luò)?,F(xiàn)代神經(jīng)科學(xué)產(chǎn)生了新的影響,但它們是由少數(shù)研究人員帶頭的。因此在AI的發(fā)展中錯失了很多機會。在過去幾十年中,通過NIH,腦計劃等努力,我們積累了大量關(guān)于支撐自然智能的解剖學(xué)和功能結(jié)構(gòu)的大腦知識。NeuroAI是神經(jīng)科學(xué)和人工智能的交叉點,這一新興領(lǐng)域基于一個前提:對神經(jīng)計算的更好理解將揭示智能的基本成分,并催化人工智能的下一次革命,最終導(dǎo)致人工智能的能力與人類相匹配,甚至可能超過人類。我們認為,現(xiàn)在是大規(guī)模進行識別和理解生物智能原理的恰當時機,并將這些原理抽象出來用于計算機和機器人系統(tǒng)。

盡管人們傾向于關(guān)注智能行為中最具人性特征的方面,例如抽象思維和推理,并且從稀疏觀察中做出一般推斷的能力已經(jīng)以某種形式存在于已經(jīng)進化了數(shù)億年的基本感覺運動環(huán)路中。正如人工智能先驅(qū)漢斯·莫拉維克所說,抽象思維“是一種新的把戲,也許不到10萬年的歷史……有效的唯一原因是它得到了更古老、更強大、但通常是無意識的感覺運動知識的支持”,小鼠和非人靈長類動物可以作為自然智能的實驗?zāi)P汀H绻斯ぶ悄苣軌蚱ヅ渌麄兛此坪唵蔚母兄芰瓦\動能力,那么通往人類智能水平的步伐將大大縮短。因此我們相信,如果我們弄清所有動物與世界互動的核心能力,NeuroAI將帶來必要的進步。

NeuroAI面對的大型挑戰(zhàn):具身圖靈測試

1950年,阿蘭·圖靈(Alan Turing)提出了模仿游戲,以測試機器是否能表現(xiàn)出與人類行為相當或者無法區(qū)分的智能。那場比賽,現(xiàn)在廣泛被稱為圖靈測試,在比賽中,機器被訓(xùn)練來模仿人類的反應(yīng),并要求人類裁判評估真人和機器之間的對話的自然程度。圖靈提出,與其具體地說機器是否會“思考”(他認為這是一個不可能回答的問題),可以對“機器會思考嗎”這個問題進行合理替代,如我們能否區(qū)分機器與人類的會話能力來回答這個問題。圖靈測試隱含著這樣一種信念,即語言代表了人類智慧的頂峰,能夠進行對話的機器一定是智能的。在某種程度上,圖靈是對的,但在另一方面,他是錯的。雖然沒有一個人工智能系統(tǒng)通過了圖靈測試,但最近,單純基于大模型的語言系統(tǒng)可以進行令人驚訝的和令人信服的對話。在某種程度上,大語言模型的成功揭示了我們多么容易被騙,從而將智力、能動性甚至意識歸因于我們的對話者。另一個原因是,這些系統(tǒng)在某些推理任務(wù)上仍然很差。盡管最近的人工智能系統(tǒng)令人印象深刻,但它們的失敗也凸顯出圖靈忽視了一個事實,即智力遠不止于語言。當前自然語言處理系統(tǒng)所犯的許多錯誤說明了系統(tǒng)在語義、因果推理和常識等方面的根本缺乏。詞匯只有在統(tǒng)計上共同出現(xiàn)時才對模型有意義,而不是基于現(xiàn)實世界的經(jīng)驗,所以即便是最先進的語言模型功能越來越強,但他們?nèi)詿o法具備一些基本的物理常識。因此,最初制定的圖靈測試,并沒有探索像動物一樣,以靈活的方式理解物理世界的能力。此外,這種對世界的理解很可能建立在我們在無數(shù)代的自然篩選中進化出的感知運動能力基礎(chǔ)上。

因此,我們提出了一個拓展的圖靈測試,包括高級感覺運動能力的測試。最初的圖靈測試建立了一個定性標準使我們可以判斷人工智能的進展程度。拓展的“具身圖靈測試”將對人工系統(tǒng)與人類和其他動物的交互進行基準測試和比較。依據(jù)每種動物自己獨特的能力定義了各自的圖靈測試:人造海貍可以測試其筑壩的能力,人造松鼠可以測試其穿越樹木的能力。盡管如此,幾乎所有動物都有許多核心的感覺運動能力,這些核心技能為動物快速進化適應(yīng)新環(huán)境提供了堅實的基礎(chǔ)。下面我們重點介紹其中一些共同點。

與世界互動。動物的顯著特征在于能夠有目的的四處走動并與環(huán)境互動。盡管最近在優(yōu)化控制、強化學(xué)習(xí)和模擬學(xué)習(xí)方面取得了進展,但機器人在控制身體和操縱物體方面仍未達到動物級別的能力,即使是模擬的程度也達不到。當然,神經(jīng)科學(xué)可以提供關(guān)于模塊化和分層架構(gòu)的指導(dǎo),這些架構(gòu)應(yīng)用于人工系統(tǒng)以賦予人工系統(tǒng)這些能力。神經(jīng)科學(xué)還可以為我們提供一些設(shè)計原則,例如,部分自主(在沒有高級模塊輸入的情況下,層級中的低級模塊如何半自主地工作)和攤銷控制(緩慢規(guī)劃過程中產(chǎn)生的初始運動如何最終轉(zhuǎn)移到快速反射系統(tǒng))。了解特定的神經(jīng)回路如何參與不同的任務(wù),比如運動和對肢體、手及手指的精細控制,感知和行動選擇,可能為機器人如何實現(xiàn)人工智能系統(tǒng)提供了途徑,也可能為其他形式的“智能”提供解決方案,包括更多的認知領(lǐng)域。例如,我們推測,低水平運動控制的神經(jīng)環(huán)路原理有助于為人工智能系統(tǒng)中的高水平運動規(guī)劃提供更好的基礎(chǔ)。

動物行為的靈活性。另一個目標是開發(fā)人工智能系統(tǒng),該系統(tǒng)能夠產(chǎn)生類似單個動物的行為范圍,從而參與大量靈活多樣的任務(wù)。現(xiàn)代AI可以很容易地學(xué)會在像Breakout這樣的視頻游戲中只需使用像素和游戲分數(shù)信息超越人類。然而,與人類玩家不同,這些系統(tǒng)是脆弱的,對小擾動高度敏感:稍微改變游戲規(guī)則,甚至是輸入中的幾個像素,都可能導(dǎo)致災(zāi)難性的性能下降。這是因為這些系統(tǒng)學(xué)習(xí)從像素到動作的映射,不需要理解游戲中的智能體和對象以及支配它們的物理規(guī)律。同樣,自動駕駛汽車本身并不知道前面卡車上的板條箱掉落的危險,除非它確實看到過卡車上的板條箱掉落導(dǎo)致不良后果的例子。而且,即使它已經(jīng)接受過關(guān)于箱子掉落危險性的訓(xùn)練,系統(tǒng)可能會把前面汽車里吹出來的一個空塑料袋視為一種障礙,從而不惜一切代價避免,因為它實際上不知道塑料袋是什么,也不知道它在物理上有沒有威脅。這種無法處理訓(xùn)練數(shù)據(jù)中未出現(xiàn)場景的情況,是對人工智能系統(tǒng)的廣泛應(yīng)用的一個重大挑戰(zhàn)。

要想在一個不可預(yù)知和不斷變化的世界中取得成功,智能體必須靈活,并通過使用其關(guān)于此類情況可能如何進行的一般知識來掌握新情況。這可以說是動物的行為。動物天生就具備茁壯成長所需的大部分技能,或者可以從有限的經(jīng)驗中迅速獲得這些技能,這得益于它們在進化和發(fā)展過程中在現(xiàn)實世界互動方面的強大基礎(chǔ)。因此,為一項特定任務(wù)從零開始訓(xùn)練并不是動物獲得令人印象深刻的技能的方式;動物并不是一無所有地來到這個世界上,然后依靠大型標記訓(xùn)練集來學(xué)習(xí)。盡管機器學(xué)習(xí)一直在尋求繞過這種限制的方法,包括自我監(jiān)督學(xué)習(xí)、遷移學(xué)習(xí)、持續(xù)學(xué)習(xí)、元學(xué)習(xí)、一次性學(xué)習(xí)和模仿學(xué)習(xí),但這些方法都無法實現(xiàn)大多數(shù)動物身上的靈活性。因此,我們認為,為現(xiàn)實世界(甚至是簡單動物)的行為靈活性提供基礎(chǔ)的神經(jīng)環(huán)路原理,有可能極大增加人工智能系統(tǒng)的靈活性和實用性。換句話說,通過利用進化已經(jīng)參與的優(yōu)化過程,我們可以大大加快對用于現(xiàn)實世界互動的通用環(huán)路的搜索。

能源效率?,F(xiàn)代人工智能面臨的一個重要挑戰(zhàn)是能源效率,而我們的大腦已經(jīng)克服了這一挑戰(zhàn)。訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要大量的能源。例如,訓(xùn)練GPT-3等大型語言模型需要超過1000兆瓦時的電力能源,足以為一個小鎮(zhèn)供電一天。用于訓(xùn)練人工智能系統(tǒng)的總能量很大,而且增長迅速。相比之下,生物系統(tǒng)的能量效率要高得多:人腦約20瓦。大腦和計算機之間能量需求的差異源于信息處理的差異。首先,在算法層面上,現(xiàn)代大規(guī)模人工神經(jīng)網(wǎng)絡(luò),例如,大語言模型,依賴于非常大的前饋架構(gòu),隨著時間的推移,實現(xiàn)自我關(guān)注,忽略了處理遞歸順序信息的潛在能力。原因之一是目前我們在循環(huán)網(wǎng)絡(luò)中還沒有有效的信用分配計算機制。相比之下,大腦利用靈活的循環(huán)體系結(jié)構(gòu)來處理隨時間變化的序列,顯然可以高效地解決信用分配問題——甚至比當前人工神經(jīng)網(wǎng)絡(luò)中使用的前饋信用分配機制更有效。如果我們可以用大腦來指導(dǎo)如何為循環(huán)題寫設(shè)計有效的訓(xùn)練機制,那么我們就有可能提高處理順序數(shù)據(jù)的能力,同時進一步提高我們系統(tǒng)的能源效率。其次,在實現(xiàn)層面,生物神經(jīng)元主要通過傳輸動作電位(峰值)進行交互,這是一種異步通信協(xié)議。就像傳統(tǒng)數(shù)字元素之間的相互作用一樣,神經(jīng)元的輸出可以被視為一串0和1;但與數(shù)字計算機不同的是,“1”(即峰值)的能量成本比“0”高幾個數(shù)量級。因為生物環(huán)路在峰值稀疏的狀態(tài)下運行——即使非常活躍的神經(jīng)元也很少在一個工作循環(huán)中超過10%,而且大多數(shù)神經(jīng)元的運行速率要低得多,因此它們的能量效率要高得多。

此外,其他因素可能有助于提高生物網(wǎng)絡(luò)能源效率。例如,生物網(wǎng)絡(luò)可以有效地進行計算,即使其中一些組件高度不可靠或“有噪音”。神經(jīng)元之間通過突觸進行交流,這種方式非常不可靠,每10條信息中只有1條被傳輸。在組織環(huán)路時,尖峰序列也是高度可變的,這一特性可能允許神經(jīng)環(huán)路執(zhí)行概率推理,這是存在不確定性時的一種魯棒計算形式。當前研究者們正在努力開發(fā)脈沖神經(jīng)網(wǎng)絡(luò)的潛力,但目前為止還沒有殺手級的應(yīng)用表明這些網(wǎng)絡(luò)能夠以生物級別的能效運行。主要問題歸結(jié)為目前的“神經(jīng)形態(tài)芯片”既不能復(fù)制先天的神經(jīng)環(huán)路功能,也不容易訓(xùn)練。因此,雖然脈沖計算的方式更節(jié)能,但用處遠不如耗能巨大的數(shù)字網(wǎng)絡(luò)。因此,我們認為,在AI中獲得更高的能源效率不僅可以通過借鑒脈沖神經(jīng)網(wǎng)絡(luò)的思想,還可以通過提供具有先天神經(jīng)環(huán)路功能和學(xué)習(xí)規(guī)則的神經(jīng)形態(tài)芯片實現(xiàn)。

解決具身圖靈測試的路線圖

如何開發(fā)能夠通過具身圖靈測試的人工系統(tǒng)?一種自然的方法是在人類進化史的指導(dǎo)下循序漸進地進行。例如,幾乎所有的動物都從事目標導(dǎo)向運動;它們會朝著某些刺激(如食物來源)移動,而遠離其他刺激(如威脅)。在這些基礎(chǔ)能力之上是更復(fù)雜的技能,如結(jié)合不同感官信息流(如視覺和嗅覺)的能力,使用這些感官信息來區(qū)分食物來源和威脅,導(dǎo)航到之前的位置,權(quán)衡可能的獎勵和威脅以實現(xiàn)目標,并以精確的方式與世界互動,以服務(wù)于最終目標。在某種程度上,即使是非常簡單的生物,如蠕蟲,也能發(fā)現(xiàn)其具備許多復(fù)雜的能力。在更復(fù)雜的動物中,如魚類和哺乳動物,這些能力被精心設(shè)計,并與新的策略相結(jié)合,從而形成更強大的行為策略。

進化論視角提出了一種解決具身圖靈測試的策略,即將其分解為一系列相互構(gòu)建的挑戰(zhàn)性增量測試,并在這個基礎(chǔ)上迭代優(yōu)化。此外,代表低級和中級測試挑戰(zhàn)的生物體可能包括蠕蟲、蒼蠅、魚類、嚙齒動物和靈長類動物,它們是神經(jīng)科學(xué)研究中廣泛使用的模式生物。我們在這些模式生物行為神經(jīng)環(huán)路和行為機制的基礎(chǔ)上通過計算機進行研究,構(gòu)建虛擬環(huán)境和虛擬生物。為了達到所要求的行為靈活性水平,通過圖靈測試的人工智能系統(tǒng)將面臨一系列針對物種的測試,包括自我監(jiān)督學(xué)習(xí)、持續(xù)學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)和終身記憶。這些挑戰(zhàn)可以標準化,以便對進展進行量化。最終,成功的虛擬生物可以在機器人技術(shù)的額外幫助下適應(yīng)物理世界,并用于解決現(xiàn)實世界的問題。

我們需要什么?

實現(xiàn)這些目標需要大量資源,也需要在傳統(tǒng)人工智能和神經(jīng)科學(xué)之外的許多學(xué)科做出貢獻,包括心理學(xué)、工程學(xué)、語言學(xué)等,除了簡單地利用這些領(lǐng)域的現(xiàn)有專業(yè)知識,當務(wù)之急是培訓(xùn)新一代在工程/計算科學(xué)和神經(jīng)科學(xué)方面同樣精通的人工智能研究人員。這些研究人員將借鑒神經(jīng)科學(xué)過往幾十年的進展,為人工智能研究制定根本性的新方向。最大的挑戰(zhàn)將是確定如何利用神經(jīng)科學(xué)、計算科學(xué)和其他相關(guān)領(lǐng)域的知識來協(xié)同推進我們的探索:確定大腦回路、生物物理學(xué)和化學(xué)的哪些細節(jié)是重要的,以及在人工智能的應(yīng)用中可以忽略哪些細節(jié)。因此,迫切需要在不同領(lǐng)域接受過適當培訓(xùn)的研究人員將神經(jīng)科學(xué)知識抽象出來,使其適用于計算機,并幫助設(shè)計實驗,以產(chǎn)生與人工智能相關(guān)的新的神經(jīng)生物學(xué)見解。該研究項目的成功取決于神經(jīng)科學(xué)和人工智能領(lǐng)域的專家研究人員群體的形成。

其次,我們需要創(chuàng)建一個能夠開發(fā)和測試這些虛擬智能體的共享平臺。在創(chuàng)建一個迭代的、具體化的圖靈測試和進化人工有機體來解決這個問題時,我們將面臨的最大技術(shù)挑戰(zhàn)之一是計算能力。目前,在專用分布式硬件上針對單個具體任務(wù)訓(xùn)練一個大型神經(jīng)網(wǎng)絡(luò)模型(如三維空間)可能需要數(shù)天時間。為了讓多個研究小組在越來越復(fù)雜的具身圖靈測試上一起工作,在多代的進化中優(yōu)化和評估大量的智能體,我們需要在共享計算平臺上進行大量投資。就像物理學(xué)中的粒子加速器或天文學(xué)中的大型望遠鏡一樣,這種大規(guī)模的共享資源對于推動腦啟發(fā)的AI研究至關(guān)重要。實現(xiàn)這個目標需要一個大型組織的努力,還需要政府和來自工業(yè)界的支持,其核心目標是在動物和類腦智能上面取得進步。

第三,我們需要支持計算神經(jīng)科學(xué)的基礎(chǔ)理論和實驗研究。在過去的幾十年里,通過NIH的努力,在很大程度上由于“腦計劃”和其他主要資助方的努力,我們已經(jīng)了解了大量關(guān)于大腦的知識?,F(xiàn)在,我們對大腦單個細胞元素、神經(jīng)元的巨大多樣性,以及它們作為簡單環(huán)路的一部分是如何發(fā)揮作用的,已經(jīng)有了一定的了解。有了這些構(gòu)建模塊,我們就可以將注意力轉(zhuǎn)向理解大腦作為一個綜合智能系統(tǒng)是如何運作的。這將需要深入了解1000種不同類型的1000億個神經(jīng)元是如何連接在一起的,以及其計算能力,即智能是如何連接在一起的,每個神經(jīng)元都與數(shù)千個其他神經(jīng)元進行通信,并具有可變的、可適應(yīng)的連接。我們必須對大腦進行逆向工程,把基本原理抽象出來。請注意,虛擬智能體的發(fā)展本身將大大加快這一努力,因為它允許在真實動物和數(shù)字動物的實驗之間進行直接比較,這些嘗試將提供對魯棒控制、靈活行為、能源效率和智能行為所必需的神經(jīng)環(huán)路級別屬性和機制的洞察。利用神經(jīng)科學(xué)和人工智能之間強大的協(xié)同效應(yīng)需要項目和基礎(chǔ)設(shè)施支持,以組織和實現(xiàn)跨學(xué)科的大規(guī)模研究。

結(jié)論

盡管神經(jīng)科學(xué)在推動AI發(fā)展方面歷史悠久,且未來發(fā)展的潛力巨大,但AI領(lǐng)域的很多工程師和計算機專家并不了解這一段歷史,也鮮有了解的機會。在典型的計算機課程中,很少提到神經(jīng)科學(xué)對馮·諾依曼、圖靈和其他計算機學(xué)家的影響。NIPS等人工智能頂級會議之前展示了很多計算神經(jīng)科學(xué)和機器學(xué)習(xí)結(jié)合的最新進展,但是近年來NIPS越來越關(guān)注純粹的機器學(xué)習(xí)技術(shù)。很多相關(guān)研究人員也意識到了這一點。“工程師不會為了制造更好的飛機而研究鳥類”這句老話作為類比是失敗的,部分原因是航空先驅(qū)確實研究過鳥類,還有一些人仍在研究鳥類。此外,這種類比在更基本的層面上也不成立:現(xiàn)代航空工程的目標不是實現(xiàn)鳥類級別的飛行,而人工智能的主要目標卻是實現(xiàn)(或超過)人類級別的智能。正如計算機在許多方面超越人類一樣,比如進行質(zhì)因數(shù)分解的能力,飛機在速度、航程和載貨能力等方面也超越了鳥類。但是,如果航空工程師的目標確實是制造一種具有鳥類能力的機器,能夠在茂密的森林樹葉中飛行,并輕輕地落在樹枝上,那么他們最好密切關(guān)注鳥類是如何做到的。同樣,如果人工智能的目標是實現(xiàn)動物水平的常識性感覺運動智能,那么研究人員最好向動物學(xué)習(xí)以了解他們?nèi)绾卧诓豢深A(yù)測的世界中進化出行為方式。(Anthony Zador, Blake Richards Bence lveczky等/文 趙凱/譯)

網(wǎng)站已關(guān)閉

您的網(wǎng)站已到期,請及時續(xù)費
聯(lián)系電話:400-606-1198