2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
開放人工智能今天宣布啟動SpiningUp,一個旨在教任何人深入強化學習的項目。
開放人工智能是眾所周知的,在虛擬環(huán)境中制造出時髦的代理,學習如何獨自行走,如Humanoid v2或POLO,這是與華盛頓大學的合作。
強化學習包括在激勵環(huán)境中向代理人提供獎勵信號,以最大限度地提高其獎勵以實現(xiàn)目標。
RL已經(jīng)在重大的人工智能突破中發(fā)揮了作用,如谷歌深度思維的AlphaGo和在Dota2這樣的環(huán)境中訓練的代理。
旋轉(zhuǎn)上升包括一組重要的強化學習研究論文,一個必要的術(shù)語表,以了解RL,和一個運行練習的算法集合。
該項目的啟動不僅是為了幫助人們了解強化學習是如何工作的,而且是為了通過讓更多來自計算機科學以外的領(lǐng)域的人參與進來,朝著開放人工智能安全創(chuàng)建人工智能(AGI)的總體目標取得進展。
“解決人工智能安全問題需要具備廣泛專業(yè)知識和觀點的人,而且許多相關(guān)專業(yè)與工程或計算機科學毫無關(guān)聯(lián)。 盡管如此,每個參與者都需要學習足夠多的技術(shù)來做出明智的決定,以及幾個需要的自旋向上地址,“根據(jù)自旋向上文檔文本。
通過與開放人工智能學者和研究員合作,人們對人工智能有好奇的興趣,但在這一領(lǐng)域幾乎沒有經(jīng)驗。
除了在實現(xiàn)安全部署AGI的目標方面取得進展外,該項目的創(chuàng)建是因為今天沒有一本教科書可以提供實施強化學習所需的知識;目前的知識被鎖定在一系列不同的講座和有影響力的研究論文中。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。