2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
谷歌的DeepMind AI一直是一件特別有趣的事情。雖然我們已經(jīng)看到DeepMind AI引發(fā)了一些有趣的事情,但是代理的最新測試測試了他們在Capture the Flag等環(huán)境中協(xié)同工作和學(xué)習(xí)的能力。測試的結(jié)果并不是那么令人驚訝,但仍然令人震驚。
根據(jù)該報告,DeepMind AI代理能夠在一系列隨機(jī)生成的Quake 3 Arena地圖中進(jìn)行全面的工作和學(xué)習(xí)。每張地圖都遵循標(biāo)準(zhǔn)的Capture The Flag機(jī)制,并要求代理商共同努力贏得勝利。測試使用的Quake 3 Arena版本是定制的,但所有基本的游戲機(jī)制仍然保持不變。測試背后的想法是看看代理商在其他代理商團(tuán)隊中的表現(xiàn)如何,以及他們在與人類玩家一起玩時的工作方式。
在這些測試中使用的代理最有趣的是,他們必須從頭學(xué)習(xí)一切。他們沒有編程知道如何瞄準(zhǔn),或者一切都在哪里。他們必須學(xué)會行動,合作,甚至在他們不了解的環(huán)境中競爭。除此之外,每個代理人還將學(xué)習(xí)自己的內(nèi)部獎勵信號。所以,對于一些人來說,它可能會奪取旗幟,而其他人可能會選擇不同的內(nèi)部獎勵目標(biāo),比如捍衛(wèi)隊友或其他類似的東西。
根據(jù)報告中的記錄,測試人員參加了一場包括40名人類玩家的比賽。在錦標(biāo)賽中,人類玩家和經(jīng)紀(jì)人隨機(jī)地作為對手和隊友進(jìn)行比賽。比賽結(jié)束后進(jìn)行的調(diào)查顯示,經(jīng)紀(jì)人能夠超過人類運(yùn)動員的勝率,許多人類參與者表示他們感覺代理人之間的合作比人類參與者更多。
可以在DeepMind網(wǎng)站上閱讀有關(guān)最新測試的完整報告。這是一篇非常漫長但有趣的讀物,特別是如果你對人工智能的未來感興趣的話。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。