英特爾研究人員承諾使用新的混合算法更快地進(jìn)行AI培訓(xùn)

2022-08-25 21:25:41 編輯：黎鵬彥來源：

導(dǎo)讀除了追求人工智能的實(shí)際應(yīng)用之外，英特爾公司還投資研究以發(fā)展該技術(shù)的理論基礎(chǔ)。芯片制造商工作的最新成果是可以加速復(fù)雜AI模型開發(fā)的算法...

除了追求人工智能的實(shí)際應(yīng)用之外，英特爾公司還投資研究以發(fā)展該技術(shù)的理論基礎(chǔ)。芯片制造商工作的最新成果是可以加速復(fù)雜AI模型開發(fā)的算法。

協(xié)同進(jìn)化強(qiáng)化學(xué)習(xí)或CERL算法今天在加利福尼亞州的ICML機(jī)器學(xué)習(xí)會議上提出。它有望加快AI項目的培訓(xùn)階段，這是開發(fā)周期中最耗時的部分之一。

工程師通過讓他們在模擬設(shè)置中反復(fù)執(zhí)行給定的任務(wù)來提高模型的準(zhǔn)確性。該過程通常涉及虛擬獎勵的使用：當(dāng)AI做正確的事情(例如，正確識別照片中的動物)時，它會得到一個積分，并將經(jīng)驗中的教訓(xùn)應(yīng)用到未來的圖像中。這是一種強(qiáng)大的方法，但是英特爾在描述CERL的學(xué)術(shù)論文中強(qiáng)調(diào)說，該方法有一定的局限性。

通過基于獎勵的培訓(xùn)來授課的神經(jīng)網(wǎng)絡(luò)通常會采取“安全路線”，以最大限度地提高其獲得的積分?jǐn)?shù)量。然后，AI承擔(dān)風(fēng)險并嘗試新方法的可能性就降低了。這最終限制了模型在訓(xùn)練期間學(xué)到的東西，這意味著一旦將模型部署到應(yīng)用程序中，模型的運(yùn)行效率可能會降低。

所謂的基于策略梯度的機(jī)器學(xué)習(xí)方法尤為突出，這是工程師訓(xùn)練AI模型的最常見方式之一。有一種沒有這種限制的替代方法-進(jìn)化強(qiáng)化學(xué)習(xí)-但它有其自身的權(quán)衡：它需要更多的硬件。英特爾的CERL算法旨在通過將兩種方法的關(guān)鍵概念組合到混合工作流程中來提供解決方案。

CERL通過生成一組具有隨機(jī)設(shè)置的神經(jīng)網(wǎng)絡(luò)來啟動培訓(xùn)課程。該算法挑選出在學(xué)習(xí)中獲得最多積分的模型，將其余的丟棄，并根據(jù)性能最高的模型生成新一批的AI。這就產(chǎn)生了一種情況，其中新一代的神經(jīng)網(wǎng)絡(luò)都比其前輩更好。

英特爾AI實(shí)驗室的工程研究負(fù)責(zé)人Somdeb Majumdar解釋說：“保留了排名最高的'精英'，其余的則被丟棄。” “我們還對精英分子進(jìn)行突變(以小擾動克隆)……以產(chǎn)生高性能的后代，以回填被丟棄的網(wǎng)絡(luò)。”

為了加快培訓(xùn)速度，英特爾研究人員為CERL配備了一種稱為重播緩沖區(qū)的機(jī)制。這是一個交流渠道，可以使每一代的神經(jīng)網(wǎng)絡(luò)彼此共享經(jīng)驗，以更快地學(xué)習(xí)。同時，第二種機(jī)制優(yōu)化了硬件分配，從而為最快學(xué)習(xí)的模型提供了更多的計算能力，從而進(jìn)一步加快了速度。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！