首頁(yè)>專題>科技中國(guó) 使命擔(dān)當(dāng)>要聞

未來(lái)AI或在社會(huì)中自行學(xué)習(xí)成長(zhǎng)，能迅速模仿人類專家的智能體出現(xiàn)

2023年11月29日 10:31 | 作者:張夢(mèng)然 | 來(lái)源：科技日?qǐng)?bào) 分享到：

據(jù)《自然·通訊》28日發(fā)表的一篇論文，谷歌“深度思維”報(bào)道了一個(gè)人工智能（AI）體，在3D模擬中，該智能體能在第一次見到的任務(wù)中極迅速地模仿人類專家，實(shí)時(shí)可靠地獲取來(lái)自人類搭檔的知識(shí)。這一研究結(jié)果是對(duì)AI實(shí)現(xiàn)快速知識(shí)傳播的一次概念驗(yàn)證，也是朝著人類—AI開放式互動(dòng)的文化演變邁出的第一步。

GoalCycle3D任務(wù)空間，圖片來(lái)源：《自然·通訊》

具身AI，是指有身體并支持物理交互的智能體。之前在物理模擬和現(xiàn)實(shí)世界中，科學(xué)家已經(jīng)證明了可用人類數(shù)據(jù)讓具身AI學(xué)習(xí)新技能。但過(guò)去的智能體通常需要在監(jiān)督下從大量第一人稱的人類演示中學(xué)習(xí)，這類獲取既昂貴又費(fèi)時(shí)。相比之下，人類本身則可以通過(guò)模仿示范者，在幾秒內(nèi)以互動(dòng)方式學(xué)會(huì)新技能，即使初生嬰兒也有這種能力。因此，科學(xué)界一直在尋求一種AI智能體，能從效率和隱私與人類相仿的其他個(gè)體那里進(jìn)行社會(huì)化學(xué)習(xí)。

“深度思維”團(tuán)隊(duì)此次利用深度強(qiáng)化學(xué)習(xí)訓(xùn)練了一個(gè)智能體，這個(gè)智能體能在名為GoalCycle3D的物理模擬任務(wù)空間里，幾分鐘就發(fā)現(xiàn)并模仿專家的行為，同時(shí)記住所學(xué)知識(shí)。訓(xùn)練后，他們發(fā)現(xiàn)這個(gè)智能體可在各種有挑戰(zhàn)性的導(dǎo)航問(wèn)題中從普通人類和AI專家那里快速學(xué)習(xí)，雖然它們以前從來(lái)沒(méi)見過(guò)人類。

比如，這個(gè)智能體可在包含大量障礙的復(fù)雜地形中穿梭。該方法的一個(gè)關(guān)鍵是一種新形式的自動(dòng)化課程，該課程結(jié)合了示范者的階段性遮蔽以及任務(wù)難度的逐步升級(jí)。而這個(gè)智能體的個(gè)體神經(jīng)元在其中能同時(shí)編碼物理信息和社會(huì)信息。

新研究結(jié)果為AI領(lǐng)域和文化演化心理學(xué)之間的密切互動(dòng)奠定了基礎(chǔ)。團(tuán)隊(duì)認(rèn)為，AI從業(yè)者可從人類社會(huì)學(xué)習(xí)中汲取靈感，構(gòu)建出適應(yīng)“人類伙伴”這一角色的具身智能體，并保護(hù)好隱私。此外，能通過(guò)社會(huì)學(xué)習(xí)的AI智能體，或?yàn)檠芯咳祟愇幕l(fā)展提供新的建模工具。

總編輯圈點(diǎn)

模仿，是嬰兒都具有的能力。他們能模仿大人的表情、語(yǔ)音語(yǔ)調(diào)、行走方式，在這一點(diǎn)上，需要被投喂大量訓(xùn)練數(shù)據(jù)的人工智能確實(shí)“相形見絀”。“深度思維”團(tuán)隊(duì)一直致力于人工智能的研究，他們開發(fā)出了多模態(tài)、多任務(wù)的智能體。如今，“深度思維”的智能體可以迅速識(shí)別和模仿人類專家行為，還能夠編碼物理信息和社會(huì)信息。這一研究再次提示我們，未來(lái)是人機(jī)共存的社會(huì)，人類和機(jī)器的交互，將改變機(jī)器學(xué)習(xí)，也改變?nèi)祟愖陨怼?/p>

編輯：馬嘉悅

人民政協(xié)報(bào)客戶端下載 >

首頁(yè)>專題>科技中國(guó) 使命擔(dān)當(dāng)>要聞

未來(lái)AI或在社會(huì)中自行學(xué)習(xí)成長(zhǎng)，能迅速模仿人類專家的智能體出現(xiàn)

友情鏈接：